GeekAlerts

جایی برای گیک‌ها

·

معرفی مدل Aeneas دیپ‌مایند، هوش مصنوعی برای کشف و تفسیر کتیبه‌های باستانی

معرفی مدل Aeneas دیپ‌مایند، هوش مصنوعی برای کشف و تفسیر کتیبه‌های باستانی
  • نام: Aeneas، هوش مصنوعی که به تاریخ‌دان‌ها کمک میکنه
  • مدت زمان مطالعه: حدود ۱۲ دقیقه
  • پیش‌نیاز: کنجکاوی در مورد تاریخ و تکنولوژی
  • اهداف:
    • یاد میگیری Aeneas چیه و دقیقا چه کاری انجام میده.
    • میفهمی چطوری به تاریخ‌دان‌ها برای تفسیر کتیبه‌های باستانی کمک میکنه.
    • با قابلیت‌های اصلی و نحوه کارکرد این مدل هوش مصنوعی آشنا میشی.
    • میبینی همکاری بین انسان و هوش مصنوعی چطور میتونه نتایج بهتری بسازه.

دنیای روم باستان رو تصور کن که توش نوشتن همه‌جا بوده؛ از روی بناهای یادبود امپراتوری گرفته تا وسایل خیلی معمولی و روزمره. از شعارهای سیاسی روی دیوارها، شعرهای عاشقانه و سنگ‌نوشته‌های قبر گرفته تا سندهای تجاری، دعوت‌نامه‌های تولد و حتی ورد و جادوها. این کتیبه‌ها به تاریخ‌دان‌های امروزی کمک میکنن تا یه دید خیلی کامل از زندگی روزمره مردم در سراسر امپراتوری روم به دست بیارن.

مشکل اینجاست که این متن‌ها معمولا تیکه پاره شدن، در اثر آب و هوا فرسوده شدن یا حتی عمدا خرابشون کردن. برای همین، بازسازی، تاریخ‌گذاری و پیدا کردن مکان اصلی این نوشته‌ها بدون داشتن اطلاعات زمینه‌ای، تقریبا غیرممکنه، مخصوصا وقتی بخوایم کتیبه‌های شبیه به هم رو مقایسه کنیم.

اینجاست که یه مدل هوش مصنوعی به اسم Aeneas معرفی میشه. این اولین مدلیه که برای دادن اطلاعات زمینه‌ای به کتیبه‌های باستانی طراحی شده تا به تاریخ‌دان‌ها کمک کنه متن‌های ناقص رو بهتر تفسیر، شناسایی و بازسازی کنن.

فصل اول: Aeneas چیه و از کجا اومده؟

وقتی تاریخ‌دان‌ها با کتیبه‌های باستانی کار میکنن، طبق روال سنتی به تخصص خودشون و منابع خاصی تکیه میکنن تا متن‌های «موازی» رو پیدا کنن. متن‌های موازی اونایی هستن که از نظر کلمه‌بندی، ساختار جمله، فرمول‌های استاندارد یا محل پیدایش، شباهت‌هایی با هم دارن.

Aeneas میتونه این کار پیچیده و زمان‌بر رو خیلی سریع‌تر انجام بده. این مدل هزاران کتیبه لاتین رو بررسی میکنه و در عرض چند ثانیه، متن‌های موازی رو از نظر متنی و زمینه‌ای پیدا میکنه. اینطوری تاریخ‌دان‌ها میتونن یافته‌های مدل رو تفسیر کنن و کارشون رو بر اساس اون پیش ببرن.

این مدل رو میشه برای زبان‌ها، خط‌ها و رسانه‌های باستانی دیگه مثل پاپیروس‌ها یا سکه‌ها هم تنظیم کرد. این یعنی قابلیت‌هاش میتونه گسترش پیدا کنه و به برقراری ارتباط بین طیف وسیع‌تری از شواهد تاریخی کمک کنه.

Aeneas با همکاری دانشگاه ناتینگهام و با مشارکت محقق‌هایی از دانشگاه‌های وارویک، آکسفورد و دانشگاه اقتصاد و تجارت آتن (AUEB) توسعه داده شده. این کار بخشی از یه تلاش بزرگ‌تر برای کشف این موضوع بوده که چطور هوش مصنوعی مولد میتونه به تاریخ‌دان‌ها کمک کنه تا متن‌های موازی رو در مقیاس بزرگ‌تر شناسایی و تفسیر کنن.

برای اینکه این تحقیق به درد افراد بیشتری بخوره، یه نسخه تعاملی از Aeneas به صورت رایگان در سایت predictingthepast.com در دسترس محقق‌ها، دانشجوها، معلم‌ها، متخصص‌های موزه و بقیه قرار گرفته. همچنین کد و مجموعه داده‌های این پروژه به صورت متن‌باز منتشر شده تا از تحقیقات بیشتر حمایت بشه.

اسم Aeneas از قهرمان سرگردان اساطیر یونان و روم گرفته شده و بر اساس مدل قبلی به اسم Ithaca ساخته شده. Ithaca هم یه مدل هوش مصنوعی برای بازسازی، تاریخ‌گذاری و تعیین مکان کتیبه‌های یونان باستان بود. اما Aeneas یه قدم جلوتر میره و به تاریخ‌دان‌ها کمک میکنه تا یه متن رو تفسیر کنن، بهش زمینه بدن، برای قطعه‌های جدا افتاده معنی پیدا کنن و در نهایت به درک بهتری از تاریخ باستان برسن.

فصل دوم: قابلیت‌های اصلی Aeneas

این مدل چندتا قابلیت پیشرفته و کلیدی داره:

  • پیدا کردن متن‌های موازی: این مدل تو یه مجموعه خیلی بزرگ از کتیبه‌های لاتین دنبال متن‌های موازی میگرده. Aeneas هر متن رو به نوعی به یه «اثر انگشت تاریخی» تبدیل میکنه و با این کار، ارتباطات عمیقی رو پیدا میکنه که به تاریخ‌دان‌ها کمک میکنه جایگاه هر کتیبه رو در بستر تاریخی وسیع‌ترش مشخص کنن.
  • پردازش ورودی چندوجهی: Aeneas اولین مدلیه که میتونه با استفاده از ورودی‌های چندوجهی، محل جغرافیایی یه متن رو مشخص کنه. یعنی هم متن و هم اطلاعات تصویری، مثل عکس‌های کتیبه، رو تحلیل میکنه.
  • بازسازی بخش‌های گمشده با طول نامشخص: برای اولین بار، Aeneas میتونه بخش‌های گمشده متن رو که طولشون مشخص نیست، بازسازی کنه. این ویژگی اون رو به یه ابزار خیلی کاربردی‌تر برای تاریخ‌دان‌هایی تبدیل میکنه که با آثار به شدت آسیب‌دیده سر و کار دارن.
  • عملکرد پیشرفته: Aeneas یه معیار جدید و پیشرفته در بازسازی متن‌های آسیب‌دیده و پیش‌بینی زمان و مکان نوشته شدن اونها به ثبت رسونده.

فصل سوم: Aeneas چطوری کار میکنه؟

Aeneas یه شبکه عصبی مولد چندوجهی هست که متن و تصویر یه کتیبه رو به عنوان ورودی میگیره. برای آموزش این مدل، یه مجموعه داده بزرگ و قابل اعتماد جمع‌آوری شده که حاصل چندین دهه کار تاریخ‌دان‌ها برای ایجاد مجموعه‌های دیجیتالی بوده. به خصوص از پایگاه داده اپیگرافی رم (EDR)، پایگاه داده اپیگرافی هایدلبرگ (EDH) و پایگاه داده اپیگرافی کلاوس اسلابی (EDCS-ELT) استفاده شده.

این سوابق پاکسازی، هماهنگ‌سازی و به هم متصل شدن تا یه مجموعه داده واحد و قابل استفاده برای ماشین به اسم مجموعه داده اپیگرافی لاتین (LED) ایجاد بشه. این مجموعه شامل بیش از ۱۷۶,۰۰۰ کتیبه لاتین از سراسر دنیای روم باستانه.

مدل Aeneas از یه رمزگشای مبتنی بر ترنسفورمر برای پردازش ورودی متنی کتیبه استفاده میکنه. شبکه‌های تخصصی هم کار بازسازی حروف و تاریخ‌گذاری رو با استفاده از متن انجام میدن، در حالی که برای تعیین محل جغرافیایی، از تصاویر کتیبه‌ها هم استفاده میشه. بعد، رمزگشا کتیبه‌های مشابه رو از مجموعه داده LED پیدا میکنه و بر اساس میزان ارتباط، اونها رو رتبه‌بندی میکنه.

سازوکار زمینه‌یابی Aeneas برای هر کتیبه، یه لیست از متن‌های موازی رو با استفاده از تکنیکی به اسم «جاسازی» یا «embeddings» پیدا میکنه. این تکنیک، اطلاعات متنی و زمینه‌ای هر کتیبه رو توی یه جور «اثر انگشت تاریخی» کدگذاری میکنه که جزئیاتی مثل محتوای متن، زبانش، زمان و مکان پیدایشش و نحوه ارتباطش با بقیه کتیبه‌ها رو شامل میشه.

فصل چهارم: Aeneas در عمل چقدر دقیقه؟

Aeneas کتیبه‌ها رو بر اساس تاریخ نوشتنشون خیلی واضح‌تر از مدل‌های عمومی دیگه‌ای که اونها هم روی زبان لاتین آموزش دیدن، دسته‌بندی میکنه.

این مدل کتیبه‌های آسیب‌دیده رو با دقت ۷۳ درصد برای ۲۰ پیش‌بینی برتر در بخش‌های گمشده تا ده حرف، بازسازی میکنه. این دقت وقتی طول بخش گمشده نامشخص باشه، فقط به ۵۸ درصد کاهش پیدا میکنه که خودش یه کار فوق‌العاده سخته. Aeneas همچنین روش استدلالش رو به شکلی قابل فهم نشون میده و نقشه‌هایی رو ارائه میده که مشخص میکنن کدوم بخش از ورودی‌ها روی پیش‌بینی‌هاش تاثیر گذاشتن. این مدل به لطف استفاده از داده‌های تصویری، میتونه یه کتیبه رو با دقت ۷۲ درصد به یکی از ۶۲ استان روم باستان نسبت بده. برای تاریخ‌گذاری هم، Aeneas یه متن رو در بازه زمانی ۱۳ سال از تاریخی که تاریخ‌دان‌ها مشخص کردن، قرار میده.

فصل پنجم: یک مثال واقعی: حل یک بحث تاریخی قدیمی

برای اینکه توانایی‌های Aeneas در یه بحث تحقیقاتی واقعی سنجیده بشه، یکی از معروف‌ترین کتیبه‌های رومی بهش داده شد: کتیبه «رس گستای دیوی آگوستی» (Res Gestae Divi Augusti) که روایت اول شخص امپراتور آگوستوس از دستاوردهاشه.

تاریخ‌دان‌ها مدت‌هاست که در مورد تاریخ‌گذاری این کتیبه بحث دارن. Aeneas به جای اینکه یه تاریخ ثابت پیش‌بینی کنه، یه توزیع دقیق از تاریخ‌های ممکن رو ارائه داد که دو قله مشخص داشت: یه قله کوچیک‌تر حدود سال ۱۰ تا ۱ قبل از میلاد و یه قله بزرگ‌تر و مطمئن‌تر بین سال‌های ۱۰ تا ۲۰ میلادی. این نتایج هر دو فرضیه اصلی تاریخ‌گذاری رو به صورت کمی نشون داد.

Aeneas پیش‌بینی‌هاش رو بر اساس ویژگی‌های ظریف زبانی و نشانگرهای تاریخی مثل عنوان‌های رسمی و بناهای یادبودی که توی متن ذکر شده بودن، انجام داد. این مدل با تبدیل سوال تاریخ‌گذاری به یه تخمین احتمالی مبتنی بر داده‌های زبانی و زمینه‌ای، یه راه جدید و کمی برای پرداختن به بحث‌های تاریخی قدیمی ارائه میده.

مهم‌تر از همه، Aeneas تعداد زیادی متن موازی مرتبط رو از متون حقوقی امپراتوری که به میراث آگوستوس گره خورده بودن، پیدا کرد. این نشون میده که چطور ایدئولوژی امپراتوری در رسانه‌ها و مناطق جغرافیایی مختلف بازتولید میشده.

فصل ششم: همکاری انسان و هوش مصنوعی

برای ارزیابی تاثیر Aeneas به عنوان یه کمک‌یار تحقیقاتی، یه مطالعه بزرگ با همکاری تاریخ‌دان‌ها و هوش مصنوعی انجام شد. از ۲۳ تاریخ‌دان که به طور منظم با کتیبه‌ها کار میکنن، دعوت شد تا مجموعه‌ای از متن‌ها رو با استفاده از Aeneas بازسازی، تاریخ‌گذاری و مکان‌یابی کنن.

نتایج نشون داد که وقتی تاریخ‌دان‌ها از اطلاعات زمینه‌ای Aeneas در کنار پیش‌بینی‌هاش برای بازسازی و شناسایی کتیبه‌های رومی استفاده کردن، به موثرترین نتایج رسیدن.

Aeneas به تاریخ‌دان‌های شرکت‌کننده در این مطالعه کمک کرد تا متن‌های موازی جدیدی پیدا کنن و اعتماد به نفسشون رو موقع انجام کارهای پیچیده اپیگرافی بالا ببرن. تاریخ‌دان‌ها به طور مداوم به ارزش Aeneas در سرعت بخشیدن به کارشون و گسترش دامنه مرتبط‌ترین کتیبه‌های موازی اشاره کردن.

فصل هفتم: آینده و ابزارهای در دسترس

Aeneas طوری طراحی شده که با روش‌های کاری فعلی تاریخ‌دان‌ها ترکیب بشه. این مدل با ترکیب دانش تخصصی و یادگیری ماشین، یه فرایند مشارکتی رو باز میکنه و پیشنهادهای قابل تفسیری رو ارائه میده که میتونه نقطه شروع خوبی برای تحقیقات تاریخی باشه.

همزمان با معرفی این مدل، مدل یونان باستان یعنی Ithaca هم به‌روزرسانی شده و حالا از قدرت Aeneas استفاده میکنه و قابلیت‌هایی مثل زمینه‌یابی، بازسازی بخش‌های گمشده با طول نامشخص و عملکرد کلی بهتر رو شامل میشه.

یه برنامه درسی جدید هم طراحی شده تا مهارت‌های فنی رو با تفکر تاریخی در کلاس درس پیوند بده. این برنامه درسی با طرح‌های سواد هوش مصنوعی مثل چارچوب شایستگی‌های دیجیتال برای شهروندان کمیسیون اروپا (DigComp 2.2)، چارچوب شایستگی هوش مصنوعی یونسکو برای دانش‌آموزان، و پیش‌نمایش چارچوب سواد هوش مصنوعی کمیسیون اروپا و سازمان همکاری و توسعه اقتصادی (OECD) هماهنگه.

تیم Aeneas به همکاری با متخصص‌های مختلف ادامه میده تا با استفاده از این ابزار، به روشن شدن گذشته باستانی ما کمک کنه.


تیم پروژه

  • رهبران تحقیق: یانیس آسل (Yannis Assael) و تیا سامرشیールド (Thea Sommerschield).
  • همکاران: آلیسون کولی (Alison Cooley)، برندن شیلینگفورد (Brendan Shillingford)، جان پاوپولوس (John Pavlopoulos)، پریانکا سورش (Priyanka Suresh)، بیلی هرمز (Bailey Herms)، جاناتان پراگ (Jonathan Prag)، الکس مالن (Alex Mullen) و شاکر محمد (Shakir Mohamed).
  • توسعه رابط وب: جاستین گریستون (Justin Grayston)، بنجامین مینارد (Benjamin Maynard) و نیکولاس دیتریش (Nicholas Dietrich) که توسط گوگل کلود پشتیبانی میشه.
  • توسعه برنامه درسی: روبه وولگارت (Robbe Wulgaert) از کالج سینت-لیونس، گنت، بلژیک.

منابع

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *