전체 글 298

챗GPT 3.5? 4.0? 이거 왜 갑자기 3.5부터 시작하는거야?

GPT-1: 1.17억개, 18년 6월 11일 출시 GPT-2: 15억개, 19년 2월 14일 출시 GPT-3: 1,750억개, 20년 6월 11일 출시 GPT-3.5는 파라미터 개수는 동일한데 사람의 의견을 받아서 추가적인 학습을 하는 (RLHF, Reinforcement Learning from Human Feedback 기술을 도입된 것이 큰 특징이다. 강화학습은 ‘알파고’를 이긴 ‘알파고제로’에서 사용하면서 주목받은 기술이다. 우리가 자전거를 배우는 과정과 비슷하다. 자전거를 배울 때 책으로 배우는 경우는 없다. 왼쪽으로 쓰러질 것 같으면 오른쪽으로 핸들을 돌리고, 오른쪽으로 쓰러지면 왼쪽으로 돌린다는 내용의 책을 독파한 후 자전거를 배우는 사람은 없다. 그냥 단순 무식하게 수십 번, 수백 번 넘..

카테고리 없음 2023.06.11

요즘 인공지능 개발 뭐가 문제일까? (합성 데이터)

인공지능을 통해 혁신적인 서비스를 제공하기 위해서는 다량의 데이터 확보가 필연적이다. 데이터를 확보하는 방법은 크게 3가지가 있다. 1. 공개 데이터 세트 활용: 이미 공개되어 있는 대규모 데이터 세트를 활용하는 것이 일반적인 방법이다. 예를 들어, 이미지 처리를 위한 ImageNet, MNIST가 가장 유명한 데이터셋이다. 2. 수집 및 크롤링: 필요한 데이터를 수집하기 위해 웹 크롤러를 사용하거나 직접 데이터를 수집할 수 있습니다. 파이썬을 이용한 beautiful soup이 대표적인 라이브러리이다. 이를 통해 인터넷에서 데이터를 확보할 수 있다. 3. 레이블링과 주석 작업: 새로운 데이터셋을 만들때 대표적인 방법이다. 사람이 데이터에 대한 레이블 또는 주석을 달아주는 작업을 의미한다. 레이블링 작업..

카테고리 없음 2023.06.11

최근 10년간 인공지능 발전의 역사

2012 합성곱 신경망 (CNN) 이미지넷챌인지에서 CNN 기반 딥러닝인 AlexNet이 우승하면서 그 동안 사람들의 관심에서 멀어졌던 인공지능 기술이 다시 크게 주목 받기 시작 2014 적대적 생성 신경망 (GAN) 생성자와 판별자가 서로 경쟁하면서 학습하는 방법. 생성자는 판별자를 이기기 위해 계속 더욱 진짜 같은 이미지를 생성하고, 판별자는 생성자가 생성한 이미지를 판결하다보면 결국은 정말로 진짜 같은 이미지를 만들어 낼 수 있음 (딥페이크) 2016 알파고 구글 딥마인드 알파고 등장으로 언론과 일반인들에게 인공지능에 대한 관심 크게 증폭 시킴 2017 트랜스포머 언어모델의 혁신 성공 문장속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망으로 수학적 기법을 활용해 서로 떨..

카테고리 없음 2022.11.04

최근 10년간 인공지능 발전의 역사

합성곱 신경망 (CNN) 이미지넷챌인지에서 CNN 기반 딥러닝인 AlexNet이 우승하면서 그 동안 사람들의 관심에서 멀어졌던 인공지능 기술이 다시 크게 주목 받기 시작 적대적 생성 신경망 (GAN) 생성자와 판별자가 서로 경쟁하면서 학습하는 방법. 생성자는 판별자를 이기기 위해 계속 더욱 진짜 같은 이미지를 생성하고, 판별자는 생성자가 생성한 이미지를 판결하다보면 결국은 정말로 진짜 같은 이미지를 만들어 낼 수 있음 (딥페이크) --> 스탠포드 대학교에서 딥페이크 감지 인공지능 개발 (정확도 96%) 알파고 구글 딥마인드 알파고 등장으로 언론과 일반인들에게 인공지능에 대한 관심 크게 증폭 시킴 트랜스포머 언어모델의 혁신 성공 문장속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신..

카테고리 없음 2022.09.21

국내 인공지능 대표 기업

알체라 CCTV 등의 동영상을 분석하는 전문 업체이며 특히 영상에서 얼굴을 분석해서 출입 감지 등에 활용할 수 있는 기술을 보유하고 있음 안면 인식을 활용해 결제 / 신분 확인 가능 실시간으로 사람이나 시설물을 진단하고 위험 요소 파악 (산물 예방 및 감시 ) 바이브컴퍼니 정부 기관이나 기업에서 발생할 수 있는 문제를 미리 예측하는 기술 보유 불법 추심, 보험 약관 오류 탐지, 보험 사기 여부 탐지 금융 포트폴리오 최적화 (금융 리스크의 예측 및 분석, 자산의 향후 흐름 예측, 수익률을 최대화) 셀바스AI 소리를 분석해서 글자나 명령어로 변경해 주는 기술 병원에 납품을 많이 하고 있으며 의무기록을 실시간으로 작성할 수 있는 것이 장점 (세브란스 병원, 한림대학교 동탄성심 병원 등에 납품) 뷰노 의료 영상..

카테고리 없음 2022.07.02

인공지능 최신 기술_연합학습 (2편)

이제 본격적으로 연합학습에 대해서 이야기 해 볼께요. 연합학습은1편에서 이야기 드린 것처럼 요즘은 흩어지는 것이 추세라고 했는데 인공지능에 흩어지는 추세를 반영한 것이라고 보면 됩니다. 인공지능을 개발하기 위해서는 최소 수백만개 이상의 데이터가 필요한데 그러기 위해서 개인이 생성한 자료를 중앙 서버에 올려서 분석해야 했습니다. 그런데, 클라우드의 단점처럼 수 많은 자료를 서버에 보내면 분석하기는 좋은데 똑같은 문제점이 생깁니다. 나의 개인정보가 모두 중앙 서버에 모이는 것을 좋아하지 않는 사람들이 생깁니다. 당연한 이야기겠죠. 또한, 중앙서버를 운영하는 입장에서도 서버 비용과 네트워크 비용이 계속 올라 갈 수 밖에 없는 것이지요. 올리는 사람도 불만이 있고, 받는 사람도 부담이 커지는 상황이 된 것입니다..

카테고리 없음 2022.07.02