본문 바로가기
뉴스

인공지능 대 인간: 어떤 기술을 더 잘 수행하나요?

by LITERARY L 2023. 8. 26.

 

인공지능 대 인간: 어떤 기술을 더 잘 수행하나요?

 

ChatGPT의 폭발적인 성장과 함께, 인공지능은 대중에게 그 존재감을 더욱 강하게 드러내고 있으며, 특히 인간의 능력의 전통적인 거점인 독해 능력, 음성 인식 및 이미지 식별 분야에서 그 영향을 보여주고 있습니다.

사실, 위의 차트에서 알 수 있듯이 인공지능은 여러 영역에서 인간의 성능을 능가하고 있으며, 다른 분야에서도 인간을 추월할 전망입니다.

성능이 어떻게 테스트되는가

 

Contextual AI의 데이터를 활용하여 AI 모델이 데이터베이스 벤치마크를 빨리 이긴 정도와 인간 수준의 기술을 이미 달성했는지 여부를 시각화합니다.

각 데이터베이스는 필체 인식, 언어 이해, 독해 등과 같은 특정한 기술을 중심으로 구성되며, 각 백분율 점수는 다음과 같은 벤치마크와 대조됩니다.

 

 

  • 0% 또는 "최대 성능 기준"
    이것은 데이터셋 생성 시점의 인공지능의 최상의 성능과 동등합니다.
  • 100%
    이 마크는 데이터셋에서 인간의 성능과 동등합니다.


이 두 지점 사이의 척도를 생성함으로써 각 데이터셋에서 AI 모델의 진전 상황을 추적할 수 있습니다. 선상의 각 점은 최상의 결과를 나타내며, 선이 상승하는 방향으로 트렌드가 형성되면 AI 모델은 점점 인간의 성능에 가까워집니다.

아래는 모든 여덟 기술에서 인공지능이 인간의 성능과 일치하기 시작한 시기에 관한 표입니다:

 

차트에서의 주요 관찰은 2010년 이후 얼마나 많은 진전이 이루어졌는지입니다. 사실 SQuAD, GLUE 및 HellaSwag와 같은 많은 데이터베이스는 2015년 이전에는 존재하지 않았습니다.

벤치마크가 더 이상 사용되지 않는 상황에 대응하여 최신 데이터베이스 중 일부는 지속적으로 새로운 관련 데이터 포인트로 업데이트됩니다. 이것이 AI 모델이 기술적으로 아직 어떤 영역(학교 수학 및 코드 생성)에서는 인간의 성능과 일치하지 않는 이유입니다. 그러나 그들은 이미 길을 걷고 있습니다.

인간을 능가하는 이유는 무엇일까요?


하지만 지난 몇 년간 AI 능력의 빠른 성장을 이끈 것은 무엇일까요?

컴퓨팅 파워, 데이터 활용 가능성 및 더 나은 알고리즘의 혁명 덕분에 AI 모델은 더 빠르며, 더 큰 데이터셋을 학습하는 데 사용되며, 심지어 10년 전과 비교해 효율적으로 최적화되었습니다.

이것이 어째서 표준화된 테스트에서 AI 언어 모델이 인간의 성능을 맞추거나 뛰어넘는다는 제목들이 빈번히 언급되는 이유입니다. 실제로 AI 개발자들에게 중요한 문제 중 하나는 모델이 그들을 테스트하기 위해 고안된 벤치마크 데이터베이스를 계속해서 이기고 있는데, 어떻게든 실제 세계 테스트에서 실패한다는 것입니다.

앞으로 몇 년 동안 더 많은 컴퓨팅 및 알고리즘적인 발전이 예상되므로, 이러한 빠른 진전은 계속될 것입니다. 그러나 AI의 진전에 대한 다음 잠재적인 병목 현상은 AI 그 자체가 아닐 수 있으며, 모델을 학습시킬 데이터의 부족일 수도 있습니다.

 

출처: 인공지능 대 인간: 어떤 기술을 더 잘 수행하나요?