생성 데이터 인텔리전스

금융 실무자가 2023년에 배운 세 가지 GenAI 용어

시간

2023년은 전쟁, 폭력, 인구 이동, 재앙, 극단주의, 높은 생활비 및 빈곤 등 지구상의 많은 사람들에게 힘든 해였습니다. 우리 업계에서 일하는 사람들은 비교적 운이 좋았으며, 우리 중 일부는 흥미진진한 GenerativeAI 토네이도에 활력을 얻었습니다. HFT가 2000년대에 자본 시장의 어휘를 변화시켰고, 디지털화가 2010년대에 은행 및 금융 서비스 어휘를 변화시켰듯이 GenAI도 꽤 빠른 속도로 새로운 AI 어휘를 우리에게 가져왔습니다.

이를 통해 우리는 많은 용어를 접하게 되었는데, 그 중 상당수는 2022년에는 거의 사용되지 않았지만 이제는 새롭거나 매우 다른 의미를 담고 있습니다. 저와 금융 서비스에 종사하는 많은 사람들은 매일 이 서비스를 사용합니다. 당신이 그렇지 않은 운이 좋지 않은 소수 중 하나라면, 여기 제가 가장 좋아하는 세 가지를 재빨리 복습해 보세요!

용어 1: 벡터 데이터베이스

소위 벡터 데이터베이스는 프롬프트에 대한 응답 품질을 향상시키는 수단으로 많은 엔터프라이즈 GenAI 스택의 핵심이 되었습니다. 데이터베이스 없이 "미세 조정" 대형 언어 모델(LLM)과 같은 대안은 비용이 많이 들고 위험 및 규정 준수 오버헤드가 많습니다. 벡터 데이터베이스는 독점 기업 정보를 캡처하고 비용 효율성을 제공하며 비교 제어 기능을 제공합니다. 금융 서비스 회사는 확실히 벡터 데이터베이스를 사용하기 위해 대기하고 있습니다.

아이러니하게도 금융 분야에서 벡터는 수년 동안 거래 및 위험 관리에서 지배적인 행렬 대수학의 필수 요소였습니다. 이러한 "벡터" 및 행렬의 데이터 저장은 일반적으로 열 형식 데이터베이스 또는 Python(Pandas), R, MATLAB 및 SAS와 같은 언어에서 사용되는 테이블 또는 데이터 프레임으로 수십 년 동안 사용되어 왔습니다. 예를 들어 선형 및 시계열 회귀와 같은 기술과 함께 금융 시계열 및 패널 데이터로 검색하고 사용하면 예측 분석, 이상 탐지 및 계량경제학이 가능해집니다. 또한 백테스트, 특히 거래, 포트폴리오 관리 및 위험 전략에 대한 정보를 제공하는 데 도움이 됩니다. 프론트 오피스와 미들 오피스인 자본 시장이 행렬 대수학 분야를 주도하는 동안 마케팅, 사기 탐지, 디지털화 등 점점 더 분석 중심적인 사용 사례가 금융 조직 전체에서 데이터 과학과 벡터를 활용했습니다.

그래서 저는 전 동료인 Dave Bergstein이 2021년 XNUMX월에 "벡터 데이터베이스" 스타트업에 입사했을 때 매료되었습니다.

벡터 데이터베이스로 복잡한 문제 해결
2022년 XNUMX월 ChatGPT 이전 버전에서 그는 매우 구체적인 벡터 유형(벡터 임베딩), 단어, 이미지 등과 같은 구조화되지 않은 정보에서 지식을 캡처하는 인코딩된 쉽게 검색할 수 있는 탐색 가능한 벡터를 강조했기 때문에 내 눈길을 끌었습니다. ChatGPT가 그해 후반에 출시되었을 때 이러한 벡터 저장소는 임베딩 유형은 의미론적 의미를 관리하는 주요 수단으로 승격되었습니다. 가장 일반적으로 저장소는 벡터 데이터베이스입니다.

지금은 많다
. 이미 금융 서비스 및 자본 시장 앱을 지원하고 있으며 가장 일반적으로

자연어 처리 사용 사례
예를 들어 법률 문서 및 재무 보고서를 요약하거나 소셜 미디어 및 뉴스 피드에서 감정을 포착합니다. 그러나 그들은 또한 더 많은 문제를 해결하고 있습니다.

관련 애플리케이션
예를 들어, 종종 전통적인 통계 및 기계 학습과 함께 거래 및 위험 관리 통찰력을 강화합니다.

덧붙여서, Dave가 합류한 회사인 Pinecone은 750억 XNUMX천만 달러의 가치를 지닌 GenAI 유니콘이 되었습니다. 당신이 그것을 얻을 수 있다면 좋은 일입니다!

2학기: RAG일명 검색 증강 생성

RAG는 ​​2023년 봄에 누구의 입에서도 거의 언급되지 않았습니다. 적어도 대문자 RAG "검색 증강 세대"라는 용어 의미에서는 그렇습니다. 2023년 XNUMX월경부터 가을/가을까지 가속화된 용어에 대한 Google 검색 통계에서는 RAG가 어디에나 있었으며, 벡터 데이터베이스가 대규모 언어 모델 "확률적 앵무새"를 길들이는 데 도움이 되는 주요 파이프라인 접근 방식이었습니다. RAG는 ​​파이프라인을 캡슐화하여 기업 데이터 워크플로를 프로비저닝하고, 다른 한편으로는 금융 회사가 환각을 줄이고 내부 및 외부 위험 관리 및 AI 규정 준수 프로세스를 수용하도록 실질적으로 지원합니다.  

다음의
다양한 종류의 RAG
파이프라인은 위협적일 정도로 복잡해 보일 수 있습니다. 그러나 RAG를 단순히 프롬프트, 엔터프라이즈 데이터 및 대규모 언어 모델 간의 데이터 파이프라인을 제공하는 것으로 생각하십시오. 자세한 내용을 알아보고 재무에 어떤 영향을 미치는지 확인하려면 내 글을 읽어보세요.

파인엑스트라 블로그
또는 시계
이 훌륭한 웹캐스트
RAG의 위험 관리 기회를 요약합니다. 어떤 단계에서든 이를 구현하기 시작하면 LangChain &
라마인덱스.

3번째 용어: 환각

나는 이전 섹션에서 "환각"이라는 용어를 사용하여 이를 RAG와 벡터 데이터베이스에 의해 해결된 문제로 간주했습니다. GenAI를 사용하면 환각은 더 이상 마약에서 영감을 받은 비틀즈의 Sergeant Pepper's Lonely Hearts Club Band 또는 Beachboys의 Good Vibrations와 같이 단순히 정신을 자극하는 창의성을 유발하는 것이 아닙니다. 그것은 많은 사람들이 실천하는 무속적 꿈의 영역도 아닙니다.
동부 시베리아 축치족요가, 마사지, 탄트라 섹스 등 마음을 바꾸는 기술을 활용하는 신체 활동도 마찬가지입니다. 이제 "환각"이라는 단어는 모델이 액세스할 수 없는 정보를 탐색하거나 기존 정보를 오용하는 LLM의 실패에도 적용됩니다. 그것은 매우 빨리 명백해졌습니다.

ChatGPT, Bard 및 유사한 시스템은 "환각" 반응을 일으키는 경향이 있었습니다.
, 이는 잘못된 정보를 바탕으로 한 행동이 이어질 때 위험을 초래했습니다. 

여기에 반전이 있습니다. AI 투자자 Marc Andreessen은 대부분의 사람들이 환각을 버그로 여기지만 AI를 활용하면 기능으로 도움이 될 수 있다고 제안합니다. 공동 창작자, 제안자, 추측자. 브레인스토밍에 도움이 되는 그들의 추측은 인간의 창의성을 촉진할 수 있습니다. 예를 들어 Andreessen은 변호사가 사건 준비 과정에서 AI의 "만들어진" 제안을 사용하여 새로운 법률 전략을 상상하는 방법을 강조합니다. 금융 서비스에서 월스트리트의 거래자들은 이미 생성 AI와 벡터 데이터베이스를 사용하여 거래 기회를 찾고 있습니다.

GenAI에 대해 어떻게 생각하시든, 이는 확실히 우리에게 유쾌하고 새로운 어휘를 가져왔습니다!

spot_img

최신 인텔리전스

spot_img