វេទិកាវិភាគ Databricks បានដាក់ឱ្យដំណើរការនូវគំរូភាសាដ៏ធំដែលមានមូលដ្ឋានលើប្រភពបើកចំហ ដោយសង្ឃឹមថាសហគ្រាសនឹងជ្រើសរើសប្រើប្រាស់ឧបករណ៍របស់ខ្លួនដើម្បីលោតលើបណ្តាញ LLM ។
The biz ដែលត្រូវបានបង្កើតឡើងនៅជុំវិញ Apache Spark បានបោះពុម្ភនូវគោលមួយចំនួនដែលអះអាងថា LLM គោលបំណងទូទៅរបស់ខ្លួន ដែលត្រូវបានគេហៅថា DBRX - បានផ្តួលគូប្រជែងប្រភពបើកចំហលើការយល់ដឹងភាសា ការសរសេរកម្មវិធី និងគណិតវិទ្យា។ អ្នកអភិវឌ្ឍន៍ក៏បានអះអាងដែរថាវាយកឈ្នះ GPT-3.5 ដែលមានកម្មសិទ្ធិរបស់ OpenAI ឆ្លងកាត់វិធានការដូចគ្នា។
DBRX ត្រូវបានបង្កើតឡើងដោយ Mosaic AI ដែល Databricks ទទួលបាន សម្រាប់ 1.3 ពាន់លានដុល្លារ ហើយបានបណ្តុះបណ្តាលលើ Nvidia DGX Cloud ។ Databricks អះអាងថាវាបានបង្កើនប្រសិទ្ធភាព DBRX សម្រាប់ប្រសិទ្ធភាពជាមួយនឹងអ្វីដែលវាហៅថាស្ថាបត្យកម្ម mix-of-experts (MoE) ដែលបណ្តាញអ្នកជំនាញច្រើន ឬអ្នកសិក្សាបែងចែកបញ្ហា។
Databricks បានពន្យល់ថា ម៉ូដែលនេះមានប៉ារ៉ាម៉ែត្រ 132 ពាន់លាន ប៉ុន្តែមានតែ 36 ពាន់លានប៉ុណ្ណោះដែលសកម្មលើការបញ្ចូលណាមួយ។
លោក Joel Minnick អនុប្រធានផ្នែកទីផ្សារ Databricks បានប្រាប់ ចុះឈ្មោះ: “នោះគឺជាហេតុផលធំមួយ ដែលម៉ូដែលនេះអាចដំណើរការបានយ៉ាងមានប្រសិទ្ធភាព ប៉ុន្តែក៏ដំណើរការបានយ៉ាងលឿនផងដែរ។ នៅក្នុងន័យជាក់ស្តែង ប្រសិនបើអ្នកប្រើប្រភេទ chatbots សំខាន់ៗណាមួយដែលនៅទីនោះថ្ងៃនេះ អ្នកប្រហែលជាធ្លាប់រង់ចាំ និងមើលចម្លើយដែលបង្កើត។ ជាមួយនឹង DBRX វានៅជិតភ្លាមៗ។
ប៉ុន្តែការអនុវត្តរបស់ម៉ូដែលខ្លួនវាមិនមែនជាចំណុចសម្រាប់ Databricks នោះទេ។ ការពិតគឺថាធ្វើឱ្យ DBRX មានសម្រាប់ ឥតគិតថ្លៃនៅលើ GitHub និង មុខឱប.
Databricks សង្ឃឹមថាអតិថិជនប្រើគំរូជាមូលដ្ឋានសម្រាប់ LLMs ផ្ទាល់ខ្លួនរបស់ពួកគេ។ ប្រសិនបើវាកើតឡើង វាអាចធ្វើឱ្យប្រសើរឡើងនូវ chatbots របស់អតិថិជន ឬការឆ្លើយសំណួរខាងក្នុង ខណៈពេលដែលបង្ហាញពីរបៀបដែល DBRX ត្រូវបានបង្កើតឡើងដោយប្រើឧបករណ៍កម្មសិទ្ធិរបស់ Databricks ។
Databricks រួមបញ្ចូលគ្នានូវសំណុំទិន្នន័យដែល DBRX ត្រូវបានបង្កើតឡើងដោយប្រើ Apache Spark និង Databricks notebooks សម្រាប់ដំណើរការទិន្នន័យ Unity Catalog សម្រាប់ការគ្រប់គ្រងទិន្នន័យ និងអភិបាលកិច្ច និង MLflow សម្រាប់ការតាមដានការពិសោធន៍។
Minnick បានបង្ហាញថាការវិនិយោគរបស់សហគ្រាសនៅក្នុង LLMs ត្រូវបានពន្យារពេលដោយការភ័យខ្លាចចំពោះភាពជាម្ចាស់ និងអភិបាលកិច្ចរបស់ភាគីទីបី។ លោកបានពន្យល់ថា "ការផ្ទេរទិន្នន័យទៅឱ្យភាគីទីបី មិនមានកម្មសិទ្ធិលើទម្ងន់គំរូ មិនអាចគ្រប់គ្រងបានពេញលេញនូវការគ្រប់គ្រងទិន្នន័យពីចុងដល់ចប់ - ទាំងនេះគឺជាអ្វីដែលធ្វើឱ្យពួកគេថយចុះ" ។
"អ្វីដែលយើងកំណត់ដើម្បីបង្កើតគឺជាគំរូ ...
លោក Hyoun Park នាយកប្រតិបត្តិ និងជាប្រធានអ្នកវិភាគនៅ Amalgam Insights បានសង្កេតឃើញពីសារៈសំខាន់នៃ DBRX គឺថា Databricks អាចបង្ហាញពីរបៀបដែលគំរូនេះត្រូវបានសាងសង់ឡើងជាជំហានៗ ជាដំណើរការសម្រាប់សហគ្រាសផ្សេងទៀតដើម្បីធ្វើតាម និងសម្រួល។
"ការរួមបញ្ចូលគ្នានៃពូជពង្ស ភាពមើលឃើញ ភាពអាចធ្វើម្តងទៀតបាន និងភាពជាម្ចាស់នៃគំរូនៅក្នុងការលៃតម្រូវគំរូ ការធ្វើតេស្ត និងប្រតិបត្តិការគឺសំខាន់ណាស់។"
Park បានកត់សម្គាល់ថាគាត់យល់ថា Databricks បានសាងសង់គំរូផ្ទាល់ខ្លួនជាង 50,000 សម្រាប់អតិថិជនរួចហើយ។ "វាគឺជាការរួមបញ្ចូលគ្នានៃបទពិសោធន៍សាងសង់គំរូ និងសមត្ថភាពក្នុងការធ្វើវាក្នុងកម្រិតមួយជាមួយនឹងគំរូដែលដំណើរការខ្ពស់ ស្របជាមួយនឹងកិច្ចខិតខំប្រឹងប្រែងឯកជន និងប្រភពបើកចំហដ៏ល្អបំផុតដែលធ្វើឱ្យការប្រកាសនេះគួរឱ្យកត់សម្គាល់ចំពោះខ្ញុំតាមទស្សនៈវិស័យ IT សហគ្រាស។"
ព័ត៌មាន DBRX លេងប្រឆាំងនឹងផ្ទៃខាងក្រោយប្រកួតប្រជែងដែលផ្លាស់ប្តូរសម្រាប់ Databricks ។ The biz មានភាពជាដៃគូយុទ្ធសាស្ត្ររយៈពេលវែងជាមួយក្រុមហ៊ុន Microsoft ដែលជាលទ្ធផលនៅក្នុង Azure Databricks – ដែលក្នុងនោះអ្នកប្រើប្រាស់ត្រូវបានសន្យាថានឹងផ្តល់សេវាកម្មទិន្នន័យរួមបញ្ចូលគ្នាយ៉ាងជិតស្និទ្ធទៅនឹងវេទិកាពពករបស់ក្រុមហ៊ុន Redmond ។
ប៉ុន្តែចាប់តាំងពីការផ្តល់ជូននេះបានចាប់ផ្តើមនៅឆ្នាំ 2017 ក្រុមហ៊ុន Microsoft បានផ្លាស់ប្តូរចូលទៅក្នុងទីផ្សារបឹងរបស់ Databricks ដែលជាកន្លែងអ្នកប្រើប្រាស់ត្រូវបានផ្តល់ជូនឃ្លាំងទិន្នន័យ និងបឹងទិន្នន័យនៅក្នុងបរិយាកាសតែមួយ ហើយសន្យាថាអ្នកប្រើប្រាស់សហគ្រាសថ្នាក់សហគ្រាស LLMs ជាមួយ 10 ពាន់លានដុល្លាររបស់ខ្លួន។ ភាពជាដៃគូ OpenAI ។ នៅក្នុងបរិយាកាសក្រណាត់របស់វា ក្រុមហ៊ុន Microsoft ក៏អាចផ្តល់ជូនផងដែរ។ "ការឆ្លុះបញ្ចាំង" ពីប្រព័ន្ធមូលដ្ឋានទិន្នន័យប្រតិបត្តិការរបស់ខ្លួន Azure Cosmos DB និង Azure SQL DB ដែលផ្តល់សិទ្ធិចូលប្រើសេវាកម្មវិភាគដោយមិនចាំបាច់ផ្លាស់ទីទិន្នន័យ។
សំណួរបើកចំហដែលព្យួរលើយុទ្ធសាស្រ្តទាំង Databricks និង Microsoft គឺនៅពេលដែលទឹកជំនន់នៃការវិនិយោគដែលរំពឹងទុកនៅក្នុងបច្ចេកវិទ្យា LLM នឹងមកដល់។ នៅខែមករា, Gartner ព្យាករណ៍ ការចំណាយរបស់សហគ្រាសលើបច្ចេកវិទ្យានឹងមិនមានក្នុងឆ្នាំនេះទេ ហើយនឹងមានផលប៉ះពាល់តិចតួចលើការវិនិយោគផ្នែកព័ត៌មានវិទ្យាផ្សេងទៀត។ ®
- SEO ដែលដំណើរការដោយមាតិកា និងការចែកចាយ PR ។ ទទួលបានការពង្រីកថ្ងៃនេះ។
- PlatoData.Network Vertical Generative Ai. ផ្តល់អំណាចដល់ខ្លួនអ្នក។ ចូលប្រើទីនេះ។
- PlatoAiStream Web3 Intelligence ។ ចំណេះដឹងត្រូវបានពង្រីក។ ចូលប្រើទីនេះ។
- ផ្លាតូអេសជី។ កាបូន CleanTech, ថាមពល, បរិស្ថាន, ពន្លឺព្រះអាទិត្យ ការគ្រប់គ្រងកាកសំណល់។ ចូលប្រើទីនេះ។
- ផ្លាតូសុខភាព។ ជីវបច្ចេកវិទ្យា និង ភាពវៃឆ្លាត សាកល្បងគ្លីនិក។ ចូលប្រើទីនេះ។
- ប្រភព: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/