تكنولوجياGemini 1.5: نموذج الذكاء الاصطناعي من الجيل التالي من Google جاهز تقريبًا

Gemini 1.5: نموذج الذكاء الاصطناعي من الجيل التالي من Google جاهز تقريبًا

بعد شهرين من إطلاق نموذج Gemini، النموذج اللغوي الكبير الذي تأمل جوجل أن يصل به إلى قمة مجال الذكاء الاصطناعي، أعلنت الشركة بالفعل عن خليفته. تطلق Google برنامج Gemini 1.5 اليوم وستجعله متاحًا قريبًا للمطورين ومستخدمي المؤسسات قبل طرحه بالكامل للمستهلكين. لقد أوضحت الشركة أن Gemini هي أداة عمل ومساعد شخصي وكل شيء بينهما، وهي تدفع هذه الخطة بقوة.

يحتوي Gemini 1.5 على الكثير من التحسينات: إن Gemini 1.5 Pro، وهو نموذج للأغراض العامة لنظام Google، يتساوى مع Gemini Ultra المتطور الذي أطلقته الشركة مؤخرًا، وقد تفوق على Gemini 1.0 Pro بنسبة 87 بالمائة. اختبارات المعيار. لقد تم تصميمه باستخدام تقنية شائعة بشكل متزايد تُعرف باسم “مركب الخبراء” أو MoE، مما يعني أنه يقوم بتشغيل جزء فقط من النموذج الإجمالي عندما ترسل إليه استعلامًا، بدلاً من معالجته طوال الوقت. (هنا شرح جيد للموضوع.) من المفترض أن يؤدي هذا الأسلوب إلى جعل النموذج أسرع بالنسبة لك لاستخدامه وأكثر كفاءة لتشغيل Google.

ولكن هناك شيء جديد في Gemini 1.5 أثار حماسة الشركة بأكملها، بدءًا من الرئيس التنفيذي Sundar Pichai، بشكل خاص: يحتوي Gemini 1.5 على نافذة سياق هائلة، مما يعني أنه يمكنه التعامل مع استفسارات أكبر بكثير وعرض المزيد من المعلومات في وقت واحد. تبلغ هذه النافذة مليون رمز، مقارنة بـ 128000 لـ GPT-4 من OpenAI و32000 لـ Gemini Pro الحالي. الرموز المميزة هي مقياس صعب الفهم (وهنا انهيار جيد)، لذلك قام بيتشاي بتبسيط الأمر: “إنه حوالي 10 أو 11 ساعة من الفيديو، وعشرات الآلاف من الأسطر.” تعني نافذة السياق أنه يمكنك أن تطلب من روبوت الذكاء الاصطناعي كل هذا المحتوى مرة واحدة.

READ  موظف في SpaceX ينتقل بنجاح من الدفع الصاروخي إلى الدفع الفضائي - Ars Technica

(يقول بيتشاي أيضًا أن باحثي Google يختبرون نافذة سياق مكونة من 10 ملايين رمز مميز – أي التسلسل بأكمله لعبة العروش في نفس الوقت.)

بينما يشرح لي هذا، يذكر بيتشاي بوضوح أنه يمكنك أن تناسب الأمر برمته ملك الخواتم ثلاثية في نافذة السياق تلك. يبدو الأمر محددًا جدًا، لذلك أسأله: لقد حدث هذا بالفعل، أليس كذلك؟ يعمل أحد الأشخاص في Google على مشروع Gemini لمعرفة ما إذا كانت هناك أي أخطاء في الاستمرارية، ولمحاولة فهم النسب المعقد لـ Middle-Earth، ومعرفة ما إذا كان الذكاء الاصطناعي يمكنه أخيرًا فهم Tom Bombadil. يقول بيتشاي ضاحكاً: “أنا متأكد من أن هذا كان سيحدث، أو سيحدث – واحد من اثنين”.

يشعر بيتشاي أيضًا أن نافذة السياق الأكبر ستكون أكثر فائدة للشركات. ويقول: “إنه يسمح لك باستخدام الحالات التي يمكنك من خلالها إضافة الكثير من السياق والمعلومات الشخصية في لحظة الاستعلام”. “فكر في الأمر كما لو أننا قمنا بتوسيع نافذة الاستعلام بشكل كبير.” يتصور أن يقوم صانعو الأفلام بتحميل فيلمهم بالكامل ويسألون الجوزاء عما قد يقوله النقاد؛ يرى الشركات التي تستخدم برج الجوزاء لعرض العديد من السجلات المالية. ويقول: “أرى أن هذا أحد الإنجازات الكبيرة التي حققناها”.

في الوقت الحالي، يتوفر Gemini 1.5 فقط لمستخدمي الأعمال والمطورين من خلال Vertex AI وAI Studio من Google. وفي نهاية المطاف، سيكون الإصدار القياسي من Gemini 1.0 وGemini Pro متاحًا للجميع. Gemini.google.com وفي تطبيقات المؤسسات – سيكون هناك 1.5 Pro مع نافذة سياق تحتوي على 128000 رمز مميز. عليك أن تدفع المزيد لتحصل على المليون. وتقوم جوجل باختبار الحدود الأمنية والأخلاقية للنموذج، خاصة فيما يتعلق بنافذة السياق الأكبر حجمًا حديثًا.

READ  Bushiroad، Eighting تكشف عن لعبة القتال Hunter x Hunter - أخبار

بينما تحاول الشركات في جميع أنحاء العالم اكتشاف استراتيجية الذكاء الاصطناعي الخاصة بها – وما إذا كانت ستوقع عقود مطورين مع OpenAI أو Google أو أي شخص آخر، فإن Google الآن في منافسة جادة لبناء أفضل أداة للذكاء الاصطناعي. في هذا الأسبوع فقط، أعلنت شركة OpenAI عن “ذاكرة” لـ ChatGPT، ويبدو أنها تستعد للبحث على الويب. حتى الآن، يبدو برج الجوزاء مثيرًا للإعجاب، خاصة بالنسبة لأولئك الموجودين بالفعل في نظام Google البيئي، ولكن هناك الكثير من العمل الذي يتعين القيام به على جميع الجوانب.

في النهاية، أتوسل إليكم، أن هذه الـ 1.0 و1.5 والإيجابيات والألتراس ومعارك الشركات لا تهم المستخدمين حقًا. يقول: “الناس يستهلكون الخبرات”. “إنه مثل استخدام الهاتف الذكي دون التركيز دائمًا على التطبيق الموجود تحته.” ولكن في الوقت الحالي، كما يقول، ما زلنا في النقطة التي يعرف فيها الجميع الشريحة الموجودة في هواتفهم لأنها مهمة. ويقول: “إن التكنولوجيا الأساسية تتغير بسرعة كبيرة”. “اهتمام الناس.”

يجب أن يقرأ