ਜਨਰੇਟਿਵ ਡਾਟਾ ਇੰਟੈਲੀਜੈਂਸ

Databricks ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ ਇਸਦਾ ਓਪਨ ਸੋਰਸ LLM GPT-3.5 ਤੋਂ ਬਾਹਰ ਹੈ

ਤਾਰੀਖ:

ਵਿਸ਼ਲੇਸ਼ਣ ਪਲੇਟਫਾਰਮ Databricks ਨੇ ਇੱਕ ਓਪਨ ਸੋਰਸ ਫਾਊਂਡੇਸ਼ਨਲ ਵਿਸ਼ਾਲ ਭਾਸ਼ਾ ਮਾਡਲ ਲਾਂਚ ਕੀਤਾ ਹੈ, ਉਮੀਦ ਹੈ ਕਿ ਉੱਦਮ LLM ਬੈਂਡਵੈਗਨ 'ਤੇ ਛਾਲ ਮਾਰਨ ਲਈ ਇਸਦੇ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਚੋਣ ਕਰਨਗੇ।

ਅਪਾਚੇ ਸਪਾਰਕ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਸਥਾਪਿਤ ਬਿਜ਼, ਨੇ ਆਪਣੇ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ LLM ਦਾ ਦਾਅਵਾ ਕਰਦੇ ਹੋਏ ਬਹੁਤ ਸਾਰੇ ਬੈਂਚਮਾਰਕ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤੇ - ਜਿਸ ਨੂੰ DBRX ਕਿਹਾ ਜਾਂਦਾ ਹੈ - ਭਾਸ਼ਾ ਦੀ ਸਮਝ, ਪ੍ਰੋਗਰਾਮਿੰਗ, ਅਤੇ ਗਣਿਤ 'ਤੇ ਓਪਨ ਸੋਰਸ ਵਿਰੋਧੀਆਂ ਨੂੰ ਹਰਾਇਆ। ਡਿਵੈਲਪਰ ਨੇ ਇਹ ਵੀ ਦਾਅਵਾ ਕੀਤਾ ਕਿ ਇਸ ਨੇ ਓਪਨਏਆਈ ਦੀ ਮਲਕੀਅਤ GPT-3.5 ਨੂੰ ਉਸੇ ਉਪਾਅ ਵਿੱਚ ਹਰਾਇਆ।

ਡੀਬੀਆਰਐਕਸ ਨੂੰ ਮੋਜ਼ੇਕ ਏਆਈ ਦੁਆਰਾ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ, ਜੋ ਕਿ ਡਾਟਾਬ੍ਰਿਕਸ ਹਾਸਲ ਕੀਤੇ $1.3 ਬਿਲੀਅਨ ਲਈ, ਅਤੇ Nvidia DGX Cloud 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ। Databricks ਦਾਅਵਾ ਕਰਦਾ ਹੈ ਕਿ ਇਸ ਨੇ DBRX ਨੂੰ ਕੁਸ਼ਲਤਾ ਲਈ ਅਨੁਕੂਲ ਬਣਾਇਆ ਹੈ ਜਿਸ ਨੂੰ ਇਹ ਮਾਹਿਰਾਂ ਦਾ ਮਿਸ਼ਰਣ (MoE) ਆਰਕੀਟੈਕਚਰ ਕਹਿੰਦੇ ਹਨ - ਜਿੱਥੇ ਕਈ ਮਾਹਰ ਨੈਟਵਰਕ ਜਾਂ ਸਿਖਿਆਰਥੀ ਇੱਕ ਸਮੱਸਿਆ ਨੂੰ ਵੰਡਦੇ ਹਨ।

ਡੇਟਾਬ੍ਰਿਕਸ ਨੇ ਸਮਝਾਇਆ ਕਿ ਮਾਡਲ ਵਿੱਚ 132 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਨ, ਪਰ ਕਿਸੇ ਇੱਕ ਇਨਪੁਟ 'ਤੇ ਸਿਰਫ 36 ਬਿਲੀਅਨ ਹੀ ਕਿਰਿਆਸ਼ੀਲ ਹਨ।

ਜੋਅਲ ਮਿਨਿਕ, ਡੇਟਾਬ੍ਰਿਕਸ ਮਾਰਕੀਟਿੰਗ ਉਪ ਪ੍ਰਧਾਨ, ਨੇ ਦੱਸਿਆ ਰਜਿਸਟਰ: “ਇਹ ਇੱਕ ਵੱਡਾ ਕਾਰਨ ਹੈ ਕਿ ਮਾਡਲ ਓਨੀ ਕੁ ਕੁਸ਼ਲਤਾ ਨਾਲ ਚਲਾਉਣ ਦੇ ਯੋਗ ਹੈ ਜਿੰਨਾ ਇਹ ਕਰਦਾ ਹੈ, ਪਰ ਇਹ ਵੀ ਬਹੁਤ ਤੇਜ਼ ਚੱਲਦਾ ਹੈ। ਵਿਹਾਰਕ ਰੂਪ ਵਿੱਚ, ਜੇ ਤੁਸੀਂ ਅੱਜ ਇੱਥੇ ਮੌਜੂਦ ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੇ ਵੱਡੇ ਚੈਟਬੋਟਸ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਜਵਾਬ ਨੂੰ ਉਤਪੰਨ ਹੋਣ ਦੀ ਉਡੀਕ ਕਰਨ ਅਤੇ ਦੇਖਣ ਦੇ ਆਦੀ ਹੋ। DBRX ਦੇ ਨਾਲ ਇਹ ਤਤਕਾਲ ਦੇ ਨੇੜੇ ਹੈ।

ਪਰ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਆਪਣੇ ਆਪ ਵਿੱਚ ਡੇਟਾਬ੍ਰਿਕਸ ਲਈ ਬਿੰਦੂ ਨਹੀਂ ਹੈ. ਬਿਜ਼, ਆਖ਼ਰਕਾਰ, ਡੀਬੀਆਰਐਕਸ ਲਈ ਉਪਲਬਧ ਕਰ ਰਿਹਾ ਹੈ GitHub 'ਤੇ ਮੁਫ਼ਤ ਅਤੇ ਜੱਫੀ ਪਾਉਣ ਵਾਲਾ ਚਿਹਰਾ.

Databricks ਉਮੀਦ ਕਰ ਰਿਹਾ ਹੈ ਕਿ ਗਾਹਕ ਆਪਣੇ ਖੁਦ ਦੇ LLM ਦੇ ਆਧਾਰ ਵਜੋਂ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨਗੇ। ਜੇਕਰ ਅਜਿਹਾ ਹੁੰਦਾ ਹੈ ਤਾਂ ਇਹ ਗਾਹਕ ਚੈਟਬੋਟਸ ਜਾਂ ਅੰਦਰੂਨੀ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬਾਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰ ਸਕਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਇਹ ਵੀ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਡੇਟਾਬ੍ਰਿਕਸ ਦੇ ਮਲਕੀਅਤ ਵਾਲੇ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਡੀਬੀਆਰਐਕਸ ਕਿਵੇਂ ਬਣਾਇਆ ਗਿਆ ਸੀ।

Databricks ਨੇ ਡੇਟਾਸੈਟ ਨੂੰ ਇਕੱਠਾ ਕੀਤਾ ਜਿਸ ਤੋਂ DBRX ਨੂੰ ਡਾਟਾ ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ Apache Spark ਅਤੇ Databricks ਨੋਟਬੁੱਕਾਂ, ਡੇਟਾ ਪ੍ਰਬੰਧਨ ਅਤੇ ਪ੍ਰਸ਼ਾਸਨ ਲਈ ਯੂਨਿਟੀ ਕੈਟਾਲਾਗ, ਅਤੇ ਪ੍ਰਯੋਗ ਟਰੈਕਿੰਗ ਲਈ MLflow ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਵਿਕਸਤ ਕੀਤਾ ਗਿਆ ਸੀ।

ਮਿਨਿਕ ਨੇ ਖੁਲਾਸਾ ਕੀਤਾ ਕਿ LLM ਵਿੱਚ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਨਿਵੇਸ਼ ਤੀਜੀ-ਧਿਰ ਦੀ ਮਲਕੀਅਤ ਅਤੇ ਸ਼ਾਸਨ ਦੇ ਡਰ ਕਾਰਨ ਦੇਰੀ ਨਾਲ ਹੋਇਆ ਸੀ। "ਡੈਟਾ ਨੂੰ ਤੀਜੀ ਧਿਰਾਂ ਕੋਲ ਭੇਜਣਾ, ਮਾਡਲ ਵੇਟ ਉੱਤੇ ਮਲਕੀਅਤ ਨਾ ਹੋਣਾ, ਡੇਟਾ ਦੇ ਅੰਤ-ਤੋਂ-ਅੰਤ ਦੇ ਸ਼ਾਸਨ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਿਯੰਤਰਿਤ ਕਰਨ ਦੇ ਯੋਗ ਨਾ ਹੋਣਾ - ਇਹ ਉਹ ਚੀਜ਼ਾਂ ਹਨ ਜੋ ਉਹਨਾਂ ਨੂੰ ਹੌਲੀ ਕਰਦੀਆਂ ਹਨ," ਉਸਨੇ ਸਮਝਾਇਆ।

"ਜੋ ਅਸੀਂ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਹੈ ਉਹ ਇੱਕ ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ... ਮਾਡਲ ਸੀ ਜਿਸਦੀ ਵਰਤੋਂ ਉੱਦਮ ਉਹਨਾਂ ਦੇ ਆਪਣੇ ਖਾਸ ਵਰਤੋਂ ਦੇ ਕੇਸਾਂ ਲਈ ਉਹਨਾਂ ਦੀਆਂ ਆਪਣੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਜਾਣ ਅਤੇ ਲਿਆਉਣ ਲਈ ਕਰ ਸਕਦੇ ਹਨ।"

ਹਿਊਨ ਪਾਰਕ, ​​ਅਮਲਗਾਮ ਇਨਸਾਈਟਸ ਦੇ ਸੀਈਓ ਅਤੇ ਮੁੱਖ ਵਿਸ਼ਲੇਸ਼ਕ, ਨੇ ਡੀਬੀਆਰਐਕਸ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਦੇਖਿਆ ਕਿ ਡੇਟਾਬ੍ਰਿਕਸ ਇਹ ਦਿਖਾ ਸਕਦਾ ਹੈ ਕਿ ਮਾਡਲ ਕਿਵੇਂ ਬਣਾਇਆ ਗਿਆ ਸੀ, ਕਦਮ-ਦਰ-ਕਦਮ, ਹੋਰ ਉੱਦਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਨ ਅਤੇ ਵਧੀਆ ਟਿਊਨ ਕਰਨ ਲਈ ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਵਜੋਂ।

"ਅੰਤ-ਤੋਂ-ਅੰਤ ਮਾਡਲ ਟਿਊਨਿੰਗ, ਟੈਸਟਿੰਗ, ਅਤੇ ਸੰਚਾਲਨ ਵਿੱਚ ਵੰਸ਼, ਦਿੱਖ, ਦੁਹਰਾਉਣਯੋਗਤਾ, ਅਤੇ ਮਾਡਲ ਮਾਲਕੀ ਦਾ ਉਹ ਸੁਮੇਲ ਮਹੱਤਵਪੂਰਨ ਹੈ."

ਪਾਰਕ ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ ਉਹ ਸਮਝਦਾ ਹੈ ਕਿ ਡੇਟਾਬ੍ਰਿਕਸ ਨੇ ਪਹਿਲਾਂ ਹੀ ਗਾਹਕਾਂ ਲਈ 50,000 ਤੋਂ ਵੱਧ ਕਸਟਮ ਮਾਡਲ ਬਣਾਏ ਹਨ। "ਇਹ ਮਾਡਲ ਬਣਾਉਣ ਦੇ ਤਜ਼ਰਬੇ ਦਾ ਸੁਮੇਲ ਹੈ ਅਤੇ ਇਸ ਨੂੰ ਵਧੀਆ ਨਿੱਜੀ ਅਤੇ ਓਪਨ ਸੋਰਸ ਯਤਨਾਂ ਦੇ ਬਰਾਬਰ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲੇ ਮਾਡਲ ਦੇ ਨਾਲ ਪੈਮਾਨੇ 'ਤੇ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਹੈ ਜੋ ਇਸ ਘੋਸ਼ਣਾ ਨੂੰ ਇੱਕ ਐਂਟਰਪ੍ਰਾਈਜ਼ IT ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਤੋਂ ਮੇਰੇ ਲਈ ਮਹੱਤਵਪੂਰਨ ਬਣਾਉਂਦਾ ਹੈ।"

DBRX ਖਬਰਾਂ Databricks ਲਈ ਬਦਲਦੇ ਪ੍ਰਤੀਯੋਗੀ ਪਿਛੋਕੜ ਦੇ ਵਿਰੁੱਧ ਖੇਡਦੀਆਂ ਹਨ। ਬਿਜ਼ ਦੀ ਮਾਈਕ੍ਰੋਸਾੱਫਟ ਦੇ ਨਾਲ ਲੰਬੇ ਸਮੇਂ ਦੀ ਰਣਨੀਤਕ ਭਾਈਵਾਲੀ ਹੈ, ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ Azure Databricks - ਜਿਸ ਵਿੱਚ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਰੈੱਡਮੰਡ ਜਾਇੰਟ ਦੇ ਕਲਾਉਡ ਪਲੇਟਫਾਰਮ ਨਾਲ ਨੇੜਿਓਂ ਜੁੜੀਆਂ ਏਕੀਕ੍ਰਿਤ ਡੇਟਾ ਸੇਵਾਵਾਂ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਗਿਆ ਹੈ।

ਪਰ 2017 ਵਿੱਚ ਲਾਂਚ ਕੀਤੀ ਗਈ ਪੇਸ਼ਕਸ਼ ਤੋਂ ਬਾਅਦ, ਮਾਈਕ੍ਰੋਸਾਫਟ ਡੇਟਾਬ੍ਰਿਕਸ ਦੇ ਲੇਕਹਾਊਸ ਮਾਰਕੀਟ ਵਿੱਚ ਆ ਗਿਆ ਹੈ - ਜਿੱਥੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇੱਕ ਵਾਤਾਵਰਣ ਵਿੱਚ ਡੇਟਾ ਵੇਅਰਹਾਊਸਿੰਗ ਅਤੇ ਡੇਟਾ ਝੀਲਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕੀਤੀ ਜਾਂਦੀ ਹੈ - ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਐਂਟਰਪ੍ਰਾਈਜ਼-ਗਰੇਡ ਐਲਐਲਐਮ ਦਾ ਵਾਅਦਾ ਕਰਦਾ ਹੈ। ਇਸ ਦੇ $10 ਬਿਲੀਅਨ OpenAI ਭਾਈਵਾਲੀ। ਇਸਦੇ ਫੈਬਰਿਕ ਵਾਤਾਵਰਣ ਵਿੱਚ, ਮਾਈਕ੍ਰੋਸਾਫਟ ਵੀ ਪੇਸ਼ ਕਰ ਸਕਦਾ ਹੈ ਇਸ ਦੇ ਟ੍ਰਾਂਜੈਕਸ਼ਨਲ ਡੇਟਾਬੇਸ ਸਿਸਟਮ ਅਜ਼ੂਰ ਕੌਸਮੌਸ ਡੀਬੀ ਅਤੇ ਅਜ਼ੂਰ ਐਸਕਿਯੂਐਲ ਡੀਬੀ ਤੋਂ "ਮਿਰਰਿੰਗ", ਡੇਟਾ ਨੂੰ ਮੂਵ ਕੀਤੇ ਬਿਨਾਂ ਵਿਸ਼ਲੇਸ਼ਣ ਸੇਵਾਵਾਂ ਤੱਕ ਪਹੁੰਚ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ।

ਡੇਟਾਬ੍ਰਿਕਸ ਅਤੇ ਮਾਈਕ੍ਰੋਸਾੱਫਟ ਦੋਵਾਂ ਦੀਆਂ ਰਣਨੀਤੀਆਂ 'ਤੇ ਲਟਕਦਾ ਇੱਕ ਖੁੱਲਾ ਸਵਾਲ ਇਹ ਹੈ ਕਿ ਐਲਐਲਐਮ ਤਕਨਾਲੋਜੀਆਂ ਵਿੱਚ ਸੰਭਾਵਿਤ ਨਿਵੇਸ਼ ਦਾ ਹੜ੍ਹ ਕਦੋਂ ਆਉਣ ਵਾਲਾ ਹੈ। ਜਨਵਰੀ ਵਿੱਚ, ਗਾਰਟਨਰ ਨੇ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ ਤਕਨਾਲੋਜੀ 'ਤੇ ਉੱਦਮ ਖਰਚ ਇਸ ਸਾਲ ਨਹੀਂ ਆਉਣਗੇ, ਅਤੇ ਹੋਰ IT ਨਿਵੇਸ਼ਾਂ 'ਤੇ ਇਸ ਦਾ ਬਹੁਤ ਘੱਟ ਪ੍ਰਭਾਵ ਪਵੇਗਾ। ®

ਸਪਾਟ_ਮਿਗ

ਨਵੀਨਤਮ ਖੁਫੀਆ ਜਾਣਕਾਰੀ

ਸਪਾਟ_ਮਿਗ

ਸਾਡੇ ਨਾਲ ਚੈਟ ਕਰੋ

ਸਤ ਸ੍ਰੀ ਅਕਾਲ! ਮੈਂ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦਾ ਹਾਂ?