- نام: Aeneas، هوش مصنوعی که به تاریخدانها کمک میکنه
- مدت زمان مطالعه: حدود ۱۲ دقیقه
- پیشنیاز: کنجکاوی در مورد تاریخ و تکنولوژی
- اهداف:
- یاد میگیری Aeneas چیه و دقیقا چه کاری انجام میده.
- میفهمی چطوری به تاریخدانها برای تفسیر کتیبههای باستانی کمک میکنه.
- با قابلیتهای اصلی و نحوه کارکرد این مدل هوش مصنوعی آشنا میشی.
- میبینی همکاری بین انسان و هوش مصنوعی چطور میتونه نتایج بهتری بسازه.
دنیای روم باستان رو تصور کن که توش نوشتن همهجا بوده؛ از روی بناهای یادبود امپراتوری گرفته تا وسایل خیلی معمولی و روزمره. از شعارهای سیاسی روی دیوارها، شعرهای عاشقانه و سنگنوشتههای قبر گرفته تا سندهای تجاری، دعوتنامههای تولد و حتی ورد و جادوها. این کتیبهها به تاریخدانهای امروزی کمک میکنن تا یه دید خیلی کامل از زندگی روزمره مردم در سراسر امپراتوری روم به دست بیارن.
مشکل اینجاست که این متنها معمولا تیکه پاره شدن، در اثر آب و هوا فرسوده شدن یا حتی عمدا خرابشون کردن. برای همین، بازسازی، تاریخگذاری و پیدا کردن مکان اصلی این نوشتهها بدون داشتن اطلاعات زمینهای، تقریبا غیرممکنه، مخصوصا وقتی بخوایم کتیبههای شبیه به هم رو مقایسه کنیم.
اینجاست که یه مدل هوش مصنوعی به اسم Aeneas معرفی میشه. این اولین مدلیه که برای دادن اطلاعات زمینهای به کتیبههای باستانی طراحی شده تا به تاریخدانها کمک کنه متنهای ناقص رو بهتر تفسیر، شناسایی و بازسازی کنن.
فصل اول: Aeneas چیه و از کجا اومده؟
وقتی تاریخدانها با کتیبههای باستانی کار میکنن، طبق روال سنتی به تخصص خودشون و منابع خاصی تکیه میکنن تا متنهای «موازی» رو پیدا کنن. متنهای موازی اونایی هستن که از نظر کلمهبندی، ساختار جمله، فرمولهای استاندارد یا محل پیدایش، شباهتهایی با هم دارن.
Aeneas میتونه این کار پیچیده و زمانبر رو خیلی سریعتر انجام بده. این مدل هزاران کتیبه لاتین رو بررسی میکنه و در عرض چند ثانیه، متنهای موازی رو از نظر متنی و زمینهای پیدا میکنه. اینطوری تاریخدانها میتونن یافتههای مدل رو تفسیر کنن و کارشون رو بر اساس اون پیش ببرن.
این مدل رو میشه برای زبانها، خطها و رسانههای باستانی دیگه مثل پاپیروسها یا سکهها هم تنظیم کرد. این یعنی قابلیتهاش میتونه گسترش پیدا کنه و به برقراری ارتباط بین طیف وسیعتری از شواهد تاریخی کمک کنه.
Aeneas با همکاری دانشگاه ناتینگهام و با مشارکت محققهایی از دانشگاههای وارویک، آکسفورد و دانشگاه اقتصاد و تجارت آتن (AUEB) توسعه داده شده. این کار بخشی از یه تلاش بزرگتر برای کشف این موضوع بوده که چطور هوش مصنوعی مولد میتونه به تاریخدانها کمک کنه تا متنهای موازی رو در مقیاس بزرگتر شناسایی و تفسیر کنن.
برای اینکه این تحقیق به درد افراد بیشتری بخوره، یه نسخه تعاملی از Aeneas به صورت رایگان در سایت predictingthepast.com در دسترس محققها، دانشجوها، معلمها، متخصصهای موزه و بقیه قرار گرفته. همچنین کد و مجموعه دادههای این پروژه به صورت متنباز منتشر شده تا از تحقیقات بیشتر حمایت بشه.
اسم Aeneas از قهرمان سرگردان اساطیر یونان و روم گرفته شده و بر اساس مدل قبلی به اسم Ithaca ساخته شده. Ithaca هم یه مدل هوش مصنوعی برای بازسازی، تاریخگذاری و تعیین مکان کتیبههای یونان باستان بود. اما Aeneas یه قدم جلوتر میره و به تاریخدانها کمک میکنه تا یه متن رو تفسیر کنن، بهش زمینه بدن، برای قطعههای جدا افتاده معنی پیدا کنن و در نهایت به درک بهتری از تاریخ باستان برسن.
فصل دوم: قابلیتهای اصلی Aeneas
این مدل چندتا قابلیت پیشرفته و کلیدی داره:
- پیدا کردن متنهای موازی: این مدل تو یه مجموعه خیلی بزرگ از کتیبههای لاتین دنبال متنهای موازی میگرده. Aeneas هر متن رو به نوعی به یه «اثر انگشت تاریخی» تبدیل میکنه و با این کار، ارتباطات عمیقی رو پیدا میکنه که به تاریخدانها کمک میکنه جایگاه هر کتیبه رو در بستر تاریخی وسیعترش مشخص کنن.
- پردازش ورودی چندوجهی: Aeneas اولین مدلیه که میتونه با استفاده از ورودیهای چندوجهی، محل جغرافیایی یه متن رو مشخص کنه. یعنی هم متن و هم اطلاعات تصویری، مثل عکسهای کتیبه، رو تحلیل میکنه.
- بازسازی بخشهای گمشده با طول نامشخص: برای اولین بار، Aeneas میتونه بخشهای گمشده متن رو که طولشون مشخص نیست، بازسازی کنه. این ویژگی اون رو به یه ابزار خیلی کاربردیتر برای تاریخدانهایی تبدیل میکنه که با آثار به شدت آسیبدیده سر و کار دارن.
- عملکرد پیشرفته: Aeneas یه معیار جدید و پیشرفته در بازسازی متنهای آسیبدیده و پیشبینی زمان و مکان نوشته شدن اونها به ثبت رسونده.
فصل سوم: Aeneas چطوری کار میکنه؟
Aeneas یه شبکه عصبی مولد چندوجهی هست که متن و تصویر یه کتیبه رو به عنوان ورودی میگیره. برای آموزش این مدل، یه مجموعه داده بزرگ و قابل اعتماد جمعآوری شده که حاصل چندین دهه کار تاریخدانها برای ایجاد مجموعههای دیجیتالی بوده. به خصوص از پایگاه داده اپیگرافی رم (EDR)، پایگاه داده اپیگرافی هایدلبرگ (EDH) و پایگاه داده اپیگرافی کلاوس اسلابی (EDCS-ELT) استفاده شده.
این سوابق پاکسازی، هماهنگسازی و به هم متصل شدن تا یه مجموعه داده واحد و قابل استفاده برای ماشین به اسم مجموعه داده اپیگرافی لاتین (LED) ایجاد بشه. این مجموعه شامل بیش از ۱۷۶,۰۰۰ کتیبه لاتین از سراسر دنیای روم باستانه.
مدل Aeneas از یه رمزگشای مبتنی بر ترنسفورمر برای پردازش ورودی متنی کتیبه استفاده میکنه. شبکههای تخصصی هم کار بازسازی حروف و تاریخگذاری رو با استفاده از متن انجام میدن، در حالی که برای تعیین محل جغرافیایی، از تصاویر کتیبهها هم استفاده میشه. بعد، رمزگشا کتیبههای مشابه رو از مجموعه داده LED پیدا میکنه و بر اساس میزان ارتباط، اونها رو رتبهبندی میکنه.
سازوکار زمینهیابی Aeneas برای هر کتیبه، یه لیست از متنهای موازی رو با استفاده از تکنیکی به اسم «جاسازی» یا «embeddings» پیدا میکنه. این تکنیک، اطلاعات متنی و زمینهای هر کتیبه رو توی یه جور «اثر انگشت تاریخی» کدگذاری میکنه که جزئیاتی مثل محتوای متن، زبانش، زمان و مکان پیدایشش و نحوه ارتباطش با بقیه کتیبهها رو شامل میشه.
فصل چهارم: Aeneas در عمل چقدر دقیقه؟
Aeneas کتیبهها رو بر اساس تاریخ نوشتنشون خیلی واضحتر از مدلهای عمومی دیگهای که اونها هم روی زبان لاتین آموزش دیدن، دستهبندی میکنه.
این مدل کتیبههای آسیبدیده رو با دقت ۷۳ درصد برای ۲۰ پیشبینی برتر در بخشهای گمشده تا ده حرف، بازسازی میکنه. این دقت وقتی طول بخش گمشده نامشخص باشه، فقط به ۵۸ درصد کاهش پیدا میکنه که خودش یه کار فوقالعاده سخته. Aeneas همچنین روش استدلالش رو به شکلی قابل فهم نشون میده و نقشههایی رو ارائه میده که مشخص میکنن کدوم بخش از ورودیها روی پیشبینیهاش تاثیر گذاشتن. این مدل به لطف استفاده از دادههای تصویری، میتونه یه کتیبه رو با دقت ۷۲ درصد به یکی از ۶۲ استان روم باستان نسبت بده. برای تاریخگذاری هم، Aeneas یه متن رو در بازه زمانی ۱۳ سال از تاریخی که تاریخدانها مشخص کردن، قرار میده.
فصل پنجم: یک مثال واقعی: حل یک بحث تاریخی قدیمی
برای اینکه تواناییهای Aeneas در یه بحث تحقیقاتی واقعی سنجیده بشه، یکی از معروفترین کتیبههای رومی بهش داده شد: کتیبه «رس گستای دیوی آگوستی» (Res Gestae Divi Augusti) که روایت اول شخص امپراتور آگوستوس از دستاوردهاشه.
تاریخدانها مدتهاست که در مورد تاریخگذاری این کتیبه بحث دارن. Aeneas به جای اینکه یه تاریخ ثابت پیشبینی کنه، یه توزیع دقیق از تاریخهای ممکن رو ارائه داد که دو قله مشخص داشت: یه قله کوچیکتر حدود سال ۱۰ تا ۱ قبل از میلاد و یه قله بزرگتر و مطمئنتر بین سالهای ۱۰ تا ۲۰ میلادی. این نتایج هر دو فرضیه اصلی تاریخگذاری رو به صورت کمی نشون داد.
Aeneas پیشبینیهاش رو بر اساس ویژگیهای ظریف زبانی و نشانگرهای تاریخی مثل عنوانهای رسمی و بناهای یادبودی که توی متن ذکر شده بودن، انجام داد. این مدل با تبدیل سوال تاریخگذاری به یه تخمین احتمالی مبتنی بر دادههای زبانی و زمینهای، یه راه جدید و کمی برای پرداختن به بحثهای تاریخی قدیمی ارائه میده.
مهمتر از همه، Aeneas تعداد زیادی متن موازی مرتبط رو از متون حقوقی امپراتوری که به میراث آگوستوس گره خورده بودن، پیدا کرد. این نشون میده که چطور ایدئولوژی امپراتوری در رسانهها و مناطق جغرافیایی مختلف بازتولید میشده.
فصل ششم: همکاری انسان و هوش مصنوعی
برای ارزیابی تاثیر Aeneas به عنوان یه کمکیار تحقیقاتی، یه مطالعه بزرگ با همکاری تاریخدانها و هوش مصنوعی انجام شد. از ۲۳ تاریخدان که به طور منظم با کتیبهها کار میکنن، دعوت شد تا مجموعهای از متنها رو با استفاده از Aeneas بازسازی، تاریخگذاری و مکانیابی کنن.
نتایج نشون داد که وقتی تاریخدانها از اطلاعات زمینهای Aeneas در کنار پیشبینیهاش برای بازسازی و شناسایی کتیبههای رومی استفاده کردن، به موثرترین نتایج رسیدن.
Aeneas به تاریخدانهای شرکتکننده در این مطالعه کمک کرد تا متنهای موازی جدیدی پیدا کنن و اعتماد به نفسشون رو موقع انجام کارهای پیچیده اپیگرافی بالا ببرن. تاریخدانها به طور مداوم به ارزش Aeneas در سرعت بخشیدن به کارشون و گسترش دامنه مرتبطترین کتیبههای موازی اشاره کردن.
فصل هفتم: آینده و ابزارهای در دسترس
Aeneas طوری طراحی شده که با روشهای کاری فعلی تاریخدانها ترکیب بشه. این مدل با ترکیب دانش تخصصی و یادگیری ماشین، یه فرایند مشارکتی رو باز میکنه و پیشنهادهای قابل تفسیری رو ارائه میده که میتونه نقطه شروع خوبی برای تحقیقات تاریخی باشه.
همزمان با معرفی این مدل، مدل یونان باستان یعنی Ithaca هم بهروزرسانی شده و حالا از قدرت Aeneas استفاده میکنه و قابلیتهایی مثل زمینهیابی، بازسازی بخشهای گمشده با طول نامشخص و عملکرد کلی بهتر رو شامل میشه.
یه برنامه درسی جدید هم طراحی شده تا مهارتهای فنی رو با تفکر تاریخی در کلاس درس پیوند بده. این برنامه درسی با طرحهای سواد هوش مصنوعی مثل چارچوب شایستگیهای دیجیتال برای شهروندان کمیسیون اروپا (DigComp 2.2)، چارچوب شایستگی هوش مصنوعی یونسکو برای دانشآموزان، و پیشنمایش چارچوب سواد هوش مصنوعی کمیسیون اروپا و سازمان همکاری و توسعه اقتصادی (OECD) هماهنگه.
تیم Aeneas به همکاری با متخصصهای مختلف ادامه میده تا با استفاده از این ابزار، به روشن شدن گذشته باستانی ما کمک کنه.
تیم پروژه
- رهبران تحقیق: یانیس آسل (Yannis Assael) و تیا سامرشیールド (Thea Sommerschield).
- همکاران: آلیسون کولی (Alison Cooley)، برندن شیلینگفورد (Brendan Shillingford)، جان پاوپولوس (John Pavlopoulos)، پریانکا سورش (Priyanka Suresh)، بیلی هرمز (Bailey Herms)، جاناتان پراگ (Jonathan Prag)، الکس مالن (Alex Mullen) و شاکر محمد (Shakir Mohamed).
- توسعه رابط وب: جاستین گریستون (Justin Grayston)، بنجامین مینارد (Benjamin Maynard) و نیکولاس دیتریش (Nicholas Dietrich) که توسط گوگل کلود پشتیبانی میشه.
- توسعه برنامه درسی: روبه وولگارت (Robbe Wulgaert) از کالج سینت-لیونس، گنت، بلژیک.
دیدگاهتان را بنویسید