ذكاء البيانات التوليدية

ثلاثة مصطلحات GenAI تعلمها الممارسون الماليون في عام 2023

التاريخ:

كان عام 2023 عامًا مزعجًا بالنسبة للكثيرين على كوكبنا - الحروب والعنف ونزوح السكان والكوارث والتطرف وارتفاع تكاليف المعيشة والفقر. كان الأشخاص الذين يعملون في صناعتنا محظوظين نسبيًا، وقد تم تنشيط البعض منا بسبب إعصار GeneativeAI المثير. مثلما حولت تقنية HFT مفردات أسواق رأس المال في العقد الأول من القرن الحادي والعشرين، كما حولت الرقمنة مفردات الخدمات المصرفية والمالية في العقد الأول من القرن الحادي والعشرين، فقد جلبت لنا GenAI معجمًا جديدًا للذكاء الاصطناعي، وبسرعة كبيرة أيضًا.

ومعها، واجهنا العديد من المصطلحات، التي نادرًا ما تم استخدامها في عام 2022، ولكنها تحمل الآن معاني جديدة أو مختلفة تمامًا. أنا والعديد من الأشخاص الآخرين في الخدمات المالية، نستخدمها خلال اليوم كل يوم. إذا كنت واحدًا من القلائل (غير) المحظوظين الذين لم يحالفهم الحظ، فإليك تجديدًا سريعًا للثلاثة المفضلين لدي!

المصطلح 1: قاعدة بيانات المتجهات

أصبحت ما يسمى بقاعدة بيانات المتجهات أساسية للعديد من مجموعات GenAI الخاصة بالمؤسسات، كوسيلة لتحسين جودة الاستجابات للمطالبات. البدائل، على سبيل المثال، "الضبط الدقيق" لنماذج اللغات الكبيرة [LLM] بدون قاعدة بيانات مصاحبة، باهظة الثمن، ومحفوفة بالمخاطر والنفقات العامة للامتثال. تقوم قاعدة البيانات المتجهة بالتقاط معلومات المؤسسة الخاصة، وتحقيق الفعالية من حيث التكلفة، وتوفير التحكم المقارن. من المؤكد أن شركات الخدمات المالية في قائمة الانتظار لاستخدام قواعد بيانات المتجهات.

ومن المفارقات في مجال التمويل، أن المتجهات ظلت لسنوات جزءًا لا يتجزأ من الجبر المصفوفي السائد في التجارة وإدارة المخاطر. تخزين البيانات لمثل هذه "المتجهات" والمصفوفات موجود أيضًا منذ عقود، عادةً في قواعد بيانات عمودية، أو كجداول أو إطارات بيانات مستخدمة في لغات مثل Python (Pandas)، وR، وMATLAB، وSAS. عند استرجاعها واستخدامها، على سبيل المثال، كبيانات سلاسل زمنية مالية وبيانات لوحة، جنبًا إلى جنب مع تقنيات مثل الانحدارات الخطية والسلاسل الزمنية، فإنها تقود التحليلات التنبؤية، واكتشاف الحالات الشاذة، والاقتصاد القياسي. كما أنها تساعد في إعلام الاختبار الخلفي، وعلى الأخص التداول وإدارة المحافظ واستراتيجيات المخاطر. في حين قادت أسواق رأس المال - المكتب الأمامي والوسطى - شحنة جبر المصفوفات، فإن حالات الاستخدام التي تركز على التحليل بشكل متزايد مثل التسويق، واكتشاف الاحتيال، والتحول الرقمي أخذت بشكل عام علم البيانات - والموجهات - عبر المؤسسات المالية.

لذلك، انبهرت عندما ذهب زميلي السابق، ديف بيرجستين، للعمل في شركة ناشئة تعمل في مجال "قاعدة بيانات المتجهات" في يونيو/حزيران 2021.

حل المشكلات المعقدة باستخدام قواعد بيانات المتجهات
من ما قبل ChatGPT في مارس 2022، لفت انتباهي لأنه سلط الضوء على أنواع ناقلات محددة للغاية - تضمينات المتجهات - ناقلات قابلة للملاحة مشفرة يسهل البحث عنها تلتقط المعرفة من معلومات غير منظمة مثل الكلمات والصور وما إلى ذلك. وعندما تم إطلاق ChatGPT في وقت لاحق من ذلك العام، كانت مخازن المتجهات لمثل هذه تم رفع مستوى أنواع التضمين لتكون وسائل رئيسية لإدارة المعنى الدلالي. في أغلب الأحيان، تكون المخازن عبارة عن قواعد بيانات متجهة، منها

هناك الآن الكثير
. وهي تعمل بالفعل على تشغيل الخدمات المالية وتطبيقات أسواق رأس المال، في أغلب الأحيان

حالات استخدام معالجة اللغة الطبيعية
على سبيل المثال، تلخيص المستندات القانونية والتقارير المالية، أو التقاط المشاعر من وسائل التواصل الاجتماعي وخلاصات الأخبار. ومع ذلك، فإنهم يتعاملون أيضًا مع المزيد

التطبيقات المعنية
، على سبيل المثال، زيادة رؤى التداول وإدارة المخاطر، جنبًا إلى جنب مع الإحصائيات التقليدية والتعلم الآلي.

وبالمناسبة، أصبحت الشركة التي ذهب ديف للانضمام إليها، وهي Pinecone، إحدى الشركات التابعة لشركة GenAI، والتي تبلغ قيمتها 750 مليون دولار. عمل جيد ان استعطت الحصول عليه!

المصطلح 2: RAG، الملقب الجيل المعزز الاسترداد

بالكاد كانت كلمة RAG على شفاه أي شخص في ربيع عام 2023، على الأقل بالمعنى الكبير للمصطلح "جيل الاسترجاع المعزز" RAG. تسارعت إحصائيات بحث Google للمصطلحات اعتبارًا من يوليو 2023 تقريبًا وبحلول الخريف/الخريف، كان RAG موجودًا في كل مكان، وهو النهج السائد الذي تساعد قواعد البيانات المتجهة من خلاله في ترويض نموذج اللغة الكبير "الببغاوات العشوائية". من ناحية، يقوم RAG بتغليف خطوط الأنابيب لتوفير سير عمل بيانات المؤسسة ومن ناحية أخرى يساعد بشكل عملي الشركات المالية على تقليل الهلوسة واستيعاب إدارة المخاطر الداخلية والخارجية وعمليات الامتثال للذكاء الاصطناعي.  

هناك
أنواع عديدة من RAG
خطوط الأنابيب، ويمكن أن تبدو معقدة بشكل مخيف. ومع ذلك، فكر في RAG ببساطة على أنه يوفر خط أنابيب للبيانات بين المطالبات وبيانات مؤسستك ونماذج اللغات الكبيرة. لمعرفة المزيد، ومعرفة مدى تأثير ذلك على التمويل، اقرأ مقالتي

مدونة فينيكسترا
أو مشاهدة
هذا البث الشبكي الرائع
تلخيص فرص إدارة المخاطر في RAG. إذا بدأت في تنفيذها في أي مرحلة، فمن المحتمل أن تستكشف بيئات "صديقة لـ RAG" مثل LangChain &
LlamaIndex.

المصطلح 3: الهلوسة

لقد استخدمت مصطلح "الهلوسة" في قسمي السابق، وطرحته على أنه مشكلة تم حلها بواسطة RAG، وبالتالي بواسطة قواعد بيانات المتجهات. مع GenAI، لم تعد الهلوسة مجرد محفزات للإبداع المحفز للعقل، مثل فرقة Sergeant Pepper's Lonely Hearts Club المستوحاة من المخدرات لفرقة البيتلز، أو Good Vibrations لفرقة Beachboys. كما أنها ليست حكرا على الحلم الشاماني الذي تمارسه العديد من الشعوب، على سبيل المثال
شعوب تشوكشي في شرق سيبيرياولا الأنشطة البدنية التي تستخدم تقنيات تغيير العقل، مثل اليوغا والتدليك وجنس التانترا. تنطبق كلمة "الهلوسة" الآن أيضًا على إخفاقات LLM في التنقل بين المعلومات التي لا تستطيع النماذج الوصول إليها، أو إساءة استخدام المعلومات الموجودة. لقد أصبح واضحًا جدًا وبسرعة كبيرة

كانت أنظمة ChatGPT وBard والأنظمة المشابهة عرضة لاستجابات "هلوسة" مصطنعة
، وقد جلبت هذه المخاطر عندما نتجت عن ذلك أعمال غير مدروسة. 

وهنا تطور. يقترح مارك أندريسن، مستثمر الذكاء الاصطناعي، أنه على الرغم من أن معظم الأشخاص ينظرون إلى الهلوسة على أنها أخطاء، إلا أنها يمكن أن تكون مفيدة كميزات عندما يتم استخدام الذكاء الاصطناعي كأداة. منشئ مشارك ومقترح وخازر. وكمساعدة في العصف الذهني، يمكن لتخميناتهم المخترعة أن تغذي الإبداع البشري. على سبيل المثال، يسلط أندريسن الضوء على كيفية استخدام المحامين لاقتراحات الذكاء الاصطناعي "المختلقة" أثناء إعداد القضية لتخيل استراتيجيات قانونية جديدة. في مجال الخدمات المالية، يستخدم المتداولون في وول ستريت بالفعل الذكاء الاصطناعي التوليدي وقواعد البيانات المتجهة للعثور على فرص التداول - للتحرك عندما تتأرجح الجماهير.

مهما كان رأيك في GenAI، فقد جلب لنا بالتأكيد معجمًا جديدًا مبهجًا!

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة