في عام 2025، سنشهد الاستفادة من الذكاء الاصطناعي والتعلم الآلي لإحراز تقدم حقيقي في فهم التواصل بين الحيوانات، والإجابة على سؤال حير البشر منذ وجودنا: “ماذا تقول الحيوانات لبعضها البعض؟” تعتبر جائزة Coller-Dolittle الأخيرة، التي تقدم جوائز نقدية تصل إلى نصف مليون دولار للعلماء الذين “يفككون الشفرات”، مؤشرًا على الثقة المتزايدة في أن التطورات التكنولوجية الحديثة في التعلم الآلي ونماذج اللغات الكبيرة (LLMs) تضع هذا الأمر موضع التنفيذ. الهدف في متناول أيدينا.
تعمل العديد من المجموعات البحثية منذ سنوات على خوارزميات لفهم أصوات الحيوانات. على سبيل المثال، قام مشروع Ceti بفك تشفير قطارات النقر لحيتان العنبر وأغاني الحيتان الحدباء. تتطلب أدوات التعلم الآلي الحديثة هذه كميات كبيرة جدًا من البيانات، وحتى الآن، لا توجد مثل هذه الكميات من البيانات عالية الجودة والمشروحة جيدًا.
خذ بعين الاعتبار برامج LLM مثل ChatGPT التي لديها بيانات تدريبية متاحة لها تتضمن كامل النص المتاح على الإنترنت. لم يكن من الممكن الوصول إلى مثل هذه المعلومات حول التواصل بين الحيوانات في الماضي. لا يقتصر الأمر على أن مجموعة البيانات البشرية أكبر بكثير من نوع البيانات التي يمكننا الوصول إليها عن الحيوانات في البرية: فقد تم استخدام أكثر من 500 جيجابايت من الكلمات لتدريب GPT-3، مقارنة بما يزيد قليلاً عن 8000 كلمة كودا. “(أو النطق) لتحليل Project Ceti الأخير لاتصالات حوت العنبر.
بالإضافة إلى ذلك، عند العمل مع اللغة البشرية، فإننا بالفعل يعرف ما يقال. حتى أننا نعرف ما الذي يشكل “كلمة”، وهي ميزة كبيرة مقارنة بتفسير التواصل بين الحيوانات، حيث نادرًا ما يعرف العلماء ما إذا كان عواء ذئب معين، على سبيل المثال، يعني شيئًا مختلفًا عن عواء ذئب آخر، أو حتى ما إذا كانت الذئاب تعتبر العواء بمثابة عواء. يشبه إلى حد ما “كلمة” في اللغة البشرية.
ومع ذلك، فإن عام 2025 سوف يجلب تطورات جديدة، سواء في كمية بيانات الاتصال الحيواني المتاحة للعلماء، أو في أنواع وقوة خوارزميات الذكاء الاصطناعي التي يمكن تطبيقها على تلك البيانات. لقد أصبح التسجيل الآلي لأصوات الحيوانات في متناول كل مجموعة بحثية علمية، مع تزايد شعبية أجهزة التسجيل منخفضة التكلفة مثل AudioMoth.
تتوفر الآن مجموعات ضخمة من البيانات على الإنترنت، حيث يمكن ترك المسجلات في الميدان، للاستماع إلى نداءات الجيبون في الغابة أو الطيور في الغابة، على مدار الساعة طوال أيام الأسبوع، عبر فترات طويلة من الزمن. كانت هناك مناسبات كان من المستحيل فيها إدارة مجموعات البيانات الضخمة يدويًا. الآن، يمكن لخوارزميات الكشف التلقائي الجديدة القائمة على الشبكات العصبية التلافيفية أن تتسابق عبر آلاف الساعات من التسجيلات، وتلتقط أصوات الحيوانات وتجميعها في أنواع مختلفة، وفقًا لخصائصها الصوتية الطبيعية.
بمجرد توفر مجموعات البيانات الحيوانية الكبيرة هذه، تصبح الخوارزميات التحليلية الجديدة ممكنة، مثل استخدام الشبكات العصبية العميقة للعثور على بنية مخفية في تسلسل أصوات الحيوانات، والتي قد تكون مماثلة للبنية ذات المعنى في اللغة البشرية.
ومع ذلك، فإن السؤال الأساسي الذي لا يزال غير واضح هو: ما الذي نأمل أن نفعله بالضبط بأصوات الحيوانات هذه؟ حددت بعض المنظمات، مثل Interspecies.io، هدفها بشكل واضح تمامًا وهو “تحويل الإشارات من أحد الأنواع إلى إشارات متماسكة لآخر”. وبعبارة أخرى، ل يترجم تواصل الحيوان مع لغة الإنسان. ومع ذلك، يتفق معظم العلماء على أن الحيوانات غير البشرية ليس لديها لغة فعلية خاصة بها، على الأقل ليس بالطريقة التي نمتلك بها نحن البشر لغة.
تعتبر جائزة Coller Dolittle أكثر تعقيدًا بعض الشيء، حيث تبحث عن طريقة “للتواصل مع كائن حي أو فك رموز اتصالاته”. يعد فك الرموز هدفًا أقل طموحًا قليلًا من الترجمة، مع الأخذ في الاعتبار احتمال عدم امتلاك الحيوانات لغة يمكن ترجمتها. اليوم، لا نعرف مقدار المعلومات التي تنقلها الحيوانات فيما بينها، أو مدى ضآلة حجمها. في عام 2025، سيكون لدى البشرية القدرة على تجاوز فهمنا ليس فقط لما تقوله الحيوانات ولكن أيضًا ما تقوله بالضبط لبعضها البعض.