생성 데이터 인텔리전스

어린이 경험은 AI에게 언어를 이해하고 말하는 방법을 가르칩니다.

시간

연구원들은 어린이의 관점에서 헤드캠 영상을 통해 AI를 훈련시켜 어린이의 환경에서 단어와 개념을 배울 수 있도록 했습니다. 

아이들은 최고의 대형 언어 모델보다 학습 능력이 더 뛰어납니다. ChatGPT 무난한 영어로 작성하기 위해 수백만 또는 심지어 1조 개의 단어가 포함된 대규모 데이터 세트로 훈련되었습니다. 

아이들이 세 살이 되면, 그 데이터의 아주 작은 부분에만 접근할 수 있음에도 불구하고 정교한 방식으로 의사소통을 할 수 있습니다.

그러나 뉴욕 대학의 학자 그룹은 다음과 같은 질문을 던졌습니다. 인공 지능 (AI) 아기처럼 배울 수 있어요. 브렌든 레이크이번 연구의 저자이자 뉴욕 대학교의 계산 인지 과학자인 는 AI 모델이 단어가 나타내는 개체와 단어를 일치시키는 데 성공했다고 말했습니다. 그에 따르면, 아이가 경험한 이 순간에도 진정한 단어 학습을 할 수 있을 만큼 충분한 데이터가 있다고 합니다.

실험

연구원들은 이번 조사를 위해 호주 어린이 헬멧 카메라에서 촬영한 61시간 분량의 영상을 사용했습니다. 생후 XNUMX개월부터 두 번째 생일 직전까지 XNUMX년 반 동안 그 아이 샘은 간헐적으로 카메라를 들고 다녔다. 

Sam이 깨어 있는 시간의 약 1%는 비디오에 포착된 내용을 보고 주의를 기울이는 데 소비되었습니다. 샘의 고양이 두 마리, 부모, 장난감과 간이 침대, 집, 음식 등이 모두 기록되었습니다. Lake는 이 데이터 세트가 고유하다고 설명했습니다. 그에 따르면, 이것은 한 명의 어린이가 이용할 수 있는 것에 대해 그들이 가졌던 가장 직접적인 견해입니다.

모델을 훈련시키기 위해 Lake와 그의 동료들은 600,000개의 비디오 프레임과 37,500개의 "발화"(Sam의 부모나 방에 있던 다른 사람들이 사진을 찍을 때 언급한 문구)를 사용했습니다. 가끔 항목과 단어가 일치하는 경우도 있습니다. 항상 그런 것은 아니었습니다. 예를 들어, Sam이 스틸에서 양식 분류기를 검사하는 동안 부모가 "문자열이 마음에 드네요"라고 말합니다. “너도 블록을 원하잖아.” 한 부모가 블록 몇 개를 덮고 있는 다른 어른의 손을 가리키며 덧붙입니다.

팀이 제공한 큐

팀은 모델에 두 가지 단서를 제공했습니다. 함께 나타나는 단어와 개체는 연결될 수 있음을 나타낼 수 있습니다. 그러나 함께 일어나지 않으면 일치하지 않는다는 신호입니다.

연구의 저자이자 컴퓨터 인지 전문가인 Wai Keen Vong 과학자 New York University에서는 모델 내에서 이런 종류의 끌어당김과 밀어내기가 발생한다고 말했습니다. 그는 계속해서 부모가 '공'이라는 단어를 말할 때 아이가 공을 보는 사례가 데이터에 충분하기를 희망한다고 말했습니다.

간단해 보일 수도 있지만 단어가 나타내는 개체에 단어를 일치시키는 작업이 필요합니다. 문제에 대한 아이디어를 얻으려면 어린 자녀가 있는 가족의 거실을 상상해 보십시오. 일반적인 거실 가구 외에도 잡동사니가 많이 있습니다. 장난감이 바닥 곳곳에 있습니다. 커피 테이블 곳곳에 크레용이 놓여 있습니다. 선반에는 스낵컵이 놓여 있고, 의자에는 세탁물이 놓여있습니다. 유아는 "공"이라는 단어를 들으면 공과 연관시킬 수 있습니다. 그러나 이는 다른 장난감, 소파, 바지 또는 사물의 모양, 색상 또는 시간을 나타낼 수도 있습니다. Lake에 따르면 모든 단어는 끝없이 많은 의미를 가질 수 있습니다.

spot_img

최신 인텔리전스

spot_img