posted by 도이모이 2022. 1. 21. 21:52

 

 

다시 본론으로 돌아가서 인공지능에 대한 이야기를 더 해 볼까요?
우리가 뉴스에서 보통 접하는 기사는 인공지능에 대해서 신기한 기술을 개발한 업체의 기술 이야기이지요.
기존에는 못하는 것을 사람처럼 잘 하거나 더 나아가 사람이 못하는 것을 할 수 있는 인공지능이 나왔을 경우 많은 기자들은 주목하게 되고 기사화 되지요.
그렇기 때문에 우리가 알고 있는 업체들은 대부분 인공지능을 개발한 업체들의 이야기입니다.
하지만, 다음 그래프를 볼까요? 포브스에서 발표한 자료입니다. 인공지능을 개발하기 위해서 들어가는 시간을 조사해서 정리한 것입니다.
보시는 것처럼 Data를 인공지능이 학습할 수 있게 필요없는 부분은 제외하고 다듬어 주는 작업인 Data cleansin에 25%의 시간이 들어가고,
인공지능이 공부하기 위해서 Data에 설명을 붙여주는 Data labeling에 25%에 시간이 들어갑니다.
이 두 작업에 전체 시간에 절반에 들어가는 것이지요.
그러고. Data Augmentation이라고 해서 데이터가 부족할때는 하나의 데이터를 가지고 이리 저리 변형해서 여러 개의 사진을 만드는 작업을 진행합니다.
여기에서 보시는 것처럼 고양이 사진이 있을 경우 이 사진을 좌로 혹은 우로 회전하고,
확대한 후 다시 회전하고, 자르고 등등의 작업을 해 줍니다. 이 작업도 전체 시간의 15%의 시간이 들어가게 됩니다.
인공지능 개발에 필요한 Algorithm 개발은 정작 3%의 시간 밖에 들어가지 않습니다.
기업 입장에서는 고급인력을 뽑아 놓고 대부분의 시간을 고급스럽지 않은 일을 할 수 밖에 없는 것이지요.
특히, 수십만개에서 수백만개의 데이터를 모으는 작업은 아무리 전문 개발자가 있어도 모을 수 있는 일이 아닙니다.
그렇기 때문에 데이터를 모아주는 전문 업체들이 주목을 받고 있습니다.
데이터를 전문적으로 모아주는 업체로는 대표적으로 Amazon Mechanical Turk라는 곳이 있습니다.
네이버에서 찾아보면 많지는 않지만 우리나라 분들 중에도 여기에서 아르바이트를 하시는 분들이 있는 거 같습니다.
Amazon Mechanical Turk에 대해 설명하는 문서를 국내에도 몇 개 찾아 볼 수 있었습니다.
아마존이 원래 인공지능으로 유명하지요.
국내에서는 영향력이 별로 없고 지금은 구글과 마이크로소프트 등도 인공지능에 대해서 크게 성장했지만
인공지능 시간을 최근 몇년간 개척한 곳은 아마존이지요. 특히, 아마존 인공지능 스피커가 유명합니다.
몇 년 전만해도 CES나 MVC같은 곳에 가면 아마존 인공지능 스피커와 연동되는 기능을 제공하는 다양한 기기들은 어렵지 않게 찾아 볼 수 있었습니다.
Amazon Mechanical Turk은 원래 다양한 클라우드 소싱을 대행해 주는 사이트였는데
인공지능이 사람들의 관심을 많이 받고 인공지능 학습에 필요한 데이터가 필요한 기업이 많아짐에 따라
Amazon Mechanical Turk가 점차적으로 인공지능 전문 데이터 수십 사이트로 자리잡아 가고 있습니다.
비슷한 사이트로는 스케일이라는 사이트가 있고요. 현재까지 우리돈으로 1800억원의 투자를 받아서 더 유명해졌습니다.
그만큼 이 시장의 성장 가능성을 크게 보고 있는 투자 업체들이 많다는 것이기로 하겠지요.
그 외에 라벨박스도 920억원 정도를 투자 받았고, 클라우드팩토리도 900억원 정도를 투자 받았습니다.
스케일보다는 적지만 거의 1000억원 가까운 돈을 투자 받은 상태입니다.
국내에도 이런 사이트가 없는 것이 아닙니다. 우리나라에는 대표적이로 클라우드웍스라는 사이트가 있고요.
네이버 시드투자를 시작으로 시리즈B 투자 유치를 완료하며 현재까지 누적 투자액 121억원을 확보한 상태입니다.
그런데 생각해보면 이런 회사들은 누구나 쉽게 만들 수 있을 거 같습니다.
쉽게 생각하면 인공지능 회사에 영업잘해서 일거리를 수주한 후 그냥 Email보내서 데이터 좀 보내 달라고 하면 될 거 깉습니다.
꼭 틀린 이야기는 아닙니다.
하지만, 경쟁력을 가지기 위해서는 빠른 시간 내에 가능한 많은 데이터를 모아서 보내 줘야합니다.
10명 ~ 100명까지는 누구나 노력하면 가능할 수 있지만 수십만명 수백만명에게 데이터를 확보하는 것은 결코 쉬운 일이 아니지요.
그러고, 데이터를 모을때는 정확성이 담보 되어야 합니다.
그러기 위해서는 사이트 개발이 필요합니다. 즉, 저렴하고 빠르고 정확한 소프트웨어 개발 능력이 필요하고 이것을 그때 그때 만들 수 없기 때문에 다양한 요구사항에 대응할 수 있는 플랫폼 개발이 필요합니다.
클라우드 소싱으로 진행 되었던 예시를 하나 보여 드리겠습니다. ‘프로젝트 사이드워크'라는 사이트입니다.
워싱턴 대학에서 인공지능으로 장애인을 위한 지도를 작성 중인 프로젝트를 진행 중이라고 합니다.
휠체어를 타고 다니는 장애인에게 지도와 네비게이션을 제공하려고 하는데 우선 데이터가 필요하겠지요.
구글 스트리트뷰를 통해보면 장애인이 지나가기 어려운 길이 보입니다.
오른쪽에 있는 사진이 실제 사진인데요.
사람들이 표시해 놓은 것을 보면 참 눈썰미 좋구나라는 생각이 듭니다.
첫번째 사진은 무슨 태그일까요? 건널목인데 자세히 보면 인도로 연결되는 부분에 살짝 턱이 있습니다.
그것을 표시해 놓았습니다.
구글 스트리트뷰는 정기적으로 돌아다니면서 사진을 찍지요. 그렇기 때문에 누군가 변한 스트리트뷰를 보고 변경이 되었을 경우,
‘Fixed’로 표시를 해 놓을 수도 있습니다.
이렇듯 인공지능을 개발하기 위해서는 비탈길, 위험한 곳을 인공지능이 학습해야 하고 이런 데이터가 필요합니다.
이런 데이터를 많이 모으기 위해서 전문 업체에게 의뢰를 한다고 할때 그냥 업체에서는 메일 보내서 캡쳐해서 달라고 할 수는 없는 일이겠지요.
데이터를 모으기 위한 소프트웨어를 그때 그때 주먹구구식으로 개발할수도 없을 것입니다.
그렇기 때문에 생각보다 소프트웨어 개발 능력이 중요합니다.
클라우드 소싱을 하기 위해 플랫폼을 가지고 있어야 합니다.
이런 업체들이 투자를 받고 성장하고 있습니다.
조금만 더 볼까요? 아이히어유((https://www.ihearu-play.eu)라는 사이트가 있습니다.
독일 연구원을 중심으로 음성 인식 연구에 필요한 데이터를 클라우드 소싱 방식으로 모으고 있습니다.
유럽을 중심으로 운영되고 있기에 주로 영어 이외 언어에 대해서 연구이고요.
주로 독일어를 연구 중입니다.
그런데 단순하게 말을 이해하는 것이 아닙니다.
훨씬 고차원적입니다. 짧은 음성을 들려주고 다양한 상황에 대해서 질문을 합니다.
밑에 있는 것처럼 뭐를 먹고 있냐고 물어 보는데 소리를 클릭해서 들어보면 처음에 바싹~ 하는 소리가 들립니다.
또한, 간단한 목소리를 들려 주고 남자 목소리 같냐, 여자 목소리 같냐고 물어 보는 식입니다.

제가 사이드워크와 아이히어유를 예를 들어 드렸는데요.
예시 둘은 비영리로 대학과 연구소에서 인공지능을 개발하기 위해서
자체 사이트에서 사이트를 만들고 자원봉사자들에게 소소하게 데이터를 확보하고 있지만 기업이라면 그럴 수 없겠지요.
이럴 경우 조금 전 이야기 드린 Amazon Mechanical Turk와 스케일 같은 회사를 찾을 수 밖에 없고 이 시간이 크게 성장하고 있습니다.

이 업체들이 보이지 않는 곳에서 큰 돈을 번 후 사라지는 웹에이젼시의 뒤를 따라 갈지
아니면 리바이스처럼 자신만의 영역을 만들어 독자적인 큰 사업이 될지는 아직 알 수 없지만
적어도 당분간은 크게 성장할 사업은 분명해 보입니다.

댓글을 달아 주세요

posted by 도이모이 2022. 1. 15. 21:27

 

 

오늘 이야기 드릴 이야기는 인공지능 시대 돈버는 업종이라는 이야기입니다. 인공지능에 대해서 이야기는 많은데 보통 언론에서는 빅테크에 대해서 이야기를 많이 하죠. 화려해보이거나 뭔가 신기하던가 아니면 놀라운 기술이 들어가던가 하는 업체 이야기를 많이합니다. 하지만, 꼭 이런 업체들이 돈을 버는 것은 아닙니다. 보이지 않는 곳에서 실제로 돈을 버는 업체들은 따로 있습니다. 이는 새로운 업종이 생겨나면 반복적으로 발생했던 일입니다. 과거부터 여러 사람의 관심을 받았지만 결국은 돈을 벌지 못했고, 다른 분야의 사람들이 큰 돈을 버는 경우가 많았습니다.

미국 골드러시 시절의 이야기를 해 볼께요. 이 글은 리바이스의 공식 홈페이지의 글을 참고했습니다. 라바이스는 1853년에 라바이 스트라우스라는 사람에 의해서 설립되었습니다. 골드 러시가 한창이던 시기에 샌프란시스코로 이주해 도매 상점을 열어, 미국 서부의 작은 소매 상점에 의류와 부츠 등 다양한 물품을 공급하는 일을 하였습니다. 여기에는 안 나와 있지만 이 때 또 했던 일이 텐트를 만드는 일이어었습니다. 개발되지 않고 아무것도 없던 미국의 서쪽으로 가서 금을 깨려고 하는데 당시 거기에는 호텔이나 모텔이 없었습니다. 우리가 서부 영화에서 보는 것처럼 중간중간 술집과 민박들이 있었지만 충분하지 않았죠. 그렇기에 텐트에 대한 수요가 많았습니다. 리바이스 역시도 마찬가지였습니다. 대량으로 텐트를 만들어서 광산 등에 납품하고 있었습니다.  

 

어느 날 "리바이 스트라우스"는 텐트를 만드는데 사용할 천을 제작해달라는 의뢰를 받고 직원들과 함께 상당한 물량의 천을 만듭니다. 그런데 한 직원의 실수로 인해 의뢰인이 요구하지도 않은 파란색 염료로 천을 염색해 버립니다. 당연히 의뢰인은 구매를 거절했고 파란색 천은 애물단지가 됩니다. 리바이 스트라우스는 이 천을 어떻게 해결할지 고민 하다가 당시 험한 일을 하던 광부들이 착용하는 바지가 잘 찢어진다는 걸 떠올립니다. 텐트는 특성상 일반 옷감에 비해 튼튼하다는 것을 리바이 스트라우스는 생각하게 됩니다. 이래서 이 천을 이용해서 옷을 만들기 시작합니다. 우리가 알고 있는 청바지는 이렇게 태어났습니다. 리바이 스트라우스와 제이콥 데이비스는 트루 블루 데님에 리벳을 활용한 작업복을 만들었고, 1873년 5월 20일 특허청은 이들에게 특허를 내주었습니다 (특허번호 139,121). “XX”라는 이름의 Blue Jean은 탄생했습니다. 

그리고, 자신들이 만든 바지는 절대 찢어지지 않는 다는 것을 강조해 홍보를 하기 시작하죠. 우리는 현재 청바지를 패션으로 입고 있죠. 그러고 최대한 찢어서 입는 것을 멋이라고 생각하는데 청바지는 원래 찢어지지 않는 옷을 만들기 위해 만든 것임을 생각해보면 참 아이러니합니다. 여기에서 보시는 것처럼 최초의 광고이자 지금까지도 사용하고 있는 로고는 양쪽에서 말 2 마리가 잡아 당겨도 찢어지지 않는 바지라는 것을 홍보하고 있습니다. 우리가 생각하는 청색은 언급도 없고 당연히 패션은 추측도 할 수 없네요. 지금도 리바이스는 청바지 시장에서 1위죠. 리바이스는 골드러시 시절부터 금을 통해 큰 돈을 벌겠다는 사람들에게 청바지를 팔아서 큰 돈을 벌었고 아직도 그 자리를 유지하고  있습니다. 


이런일은 골드러시 시절에만 있었던 것이 아닙니다. 우리나라 인터넷 초창기 시절인 90년대 후반부터 2000년 초반까지 일어났습니다. 인터넷 산업이 막 뜨기 시절하던 이 시절에 야후, 라이코스, 네이트 등 다양한 포탈 사이트가 있었지만 이들은 돈을 벌지 못했습니다. 오히려 마땅한 수익 모델이 없어서 하루가 지나면 망하는 업체들이 속출했지요. 실제로 돈을 벌면서 돈을 벌었던 회사는 웹에이젼시였습니다. 최초 인터넷 시장을 장악한 업체는 홍익인터넷이었습니다. 지금은 역사 속으로 사라졌지만 초기 웹에이젼시 중 한곳이었고 짧은 시간 내에 업계 1위로 올라서게 됩니다. 제 개인적으로도 약간의 인연이 있었던 회사이기도 합니다. 당시에는 인터넷 기술이라는 것이 HTML 밖에 없었습니다. 나중에 CGI라는 기술이 생기면서 일부 인터넷 프로그램이라는 개념이 생기긴 했지만 아직은 한계가 많아서 인터넷에서 게시판을 만들수도 없었죠. 그래서 주로 인터넷에 대한 논의를 PC통신 동호회에서 했습니다. 저는 PC 통신 중에 나우누리에 있던 인터넷 동호회인 인터넷 스터디 포럼 회장이었어요. 당시에는 당시에는 회장이라고 안 했고 시샵이라고 했거든요. System operator의 약자입니다. 사실 시스템 운영을 하는 사람은 아니기 때문에 적당한 단어는 아니였지만 당시에는 모두 다 그렇게 불렀습니다. 

 

천리안에는 유사한 동호회로 네트워크 유저 동호회라는 것이 있었는데 이곳의 시샵이 노상범이라는 분이었어요. 추진력이 강해서 수백명씩 모이는 세미나도 자주 주최하여 당시에 인기가 많은 동호회 중에 하나였습니다. 그래서 몇번 본적이 있는 사이였습니다. 여기 신문 기사보다보니 추억의 사이트가 나오네요. 홍익인터넷이 마이폴더를 흡수 합병한다고 나오네요. 마이폴더는 쉽게 말하면 소프트웨어를 모아 놓아 사이트였습니다. 당시에는 이런 사이트가 유행이었습니다. 90년대 중반부터 제가 가장 자주 이용하는 사이트가 Tucows라는 사이트였는데요. 미국 사이트였습니다. 

 

전 세계에 주요 소프트웨어를 모아 놓은 사이트라고 할 수 있었습니다. 당시에는 인터넷을 못하는 사람들이 대부분이었고 PC통신을 사용하는 사람들이 많았죠. 그래서, Tucows라는 사이트에 접속해서 소프트웨어를 다운 받은 후 간단하게 써 본 다음에 PC통신 자료실에 올리는 경우가 많았습니다. 이 Tucows를 벤치마킹해서 만든 국내 사이트가 Myfolder였는데 여기 역시도 개인적으로 알던 홍기석이라는 분이 창업한 회사였습니다. 당시에는 인터넷 사용자가 적었기 때문에, 그리가 정보도 적었고 활동할 수 있는 곳이 몇곳 없었기 때문에 인터넷 사용자들끼리는 한다리 건너면 다 아는 사이였습니다. 넷퀘스트라는 회사에도 지금도 제가 연락하고 지내는 친한 동생들이 근무도 하고 그랬던 추억의 회사입니다. 초기에는 이런 회사들이 정말 잘 나갔습니다. 

 

제 기억으로는 대기업도 당시에 인터넷 관련 인력이 2~3명에 불고했던 시절인데 홍익인터넷이 직원이 700명 정도까지 되었던 것으로 기억합니다.  불과3~4년 사이에 엄청나게 성장하며 관심을 모았습니다. 여기 신문 기사에도 써 있는 것처럼 당시만 해도 인터넷에 진출한 사업모델 중 수익모델을 가진 유일한 모델이 웹에이젼시라고 되어 있자나요. 당시에 인터넷 관련 업체들 중에서 유일하게 돈을 벌었고 전문인력도 비교가 안 되게 많았기 때문에 이들이 큰  관심을 받는 것이 당연해 보였습니다. 그러고, 여기 들어가야 기술과 프로젝트 노하우를 배울 수 있다고 생각해서 당시에는 나름 선망받는 회사 중 하나였습니다. 

 

하지만, 문제는 대기업들이 홈페이지를 다 만들자 더 이상 이들 업체를 부를 이유가 없었던 것이죠. 지금은 회사 홈페이지에서 이벤트도 하고 홍보도 하고 물건도 팔고 하지만 당시에는 그냥 회사 소개, 제품 소개, 찾아오는 길 안내 정도였거든요. 계속 돈을 쓸 이유가 없었어요. 대기업 뻔하자나요. 그러니까 일거리가 줄기 시작했습니다. 당시에 닷컴 버블이 꺼지면서 대기업들이 인터넷에 대한 투자를 줄이기 시작한것도 웹에이젼시 업체들이 힘들어진 큰 이유 중에 하나였습니다. 일거리는 줄어드는데 직원의 월급은 계속 줄수 밖에 없으니 홍익인터넷도 급격하게 어려워집니다. 이때 등장해서 짧은 시간 내에 1위 업체로 성장한 업체가 FID 입니다. 

 

여기 신문 기사 보면 국내 최대 업체가 등장했다는 기사가 2000년인데, 국내 최대 에이젼시 FID라는 신문기사가 나온것이 2002년입니다. 정말 빠르게 변하던 시기였어요. 거꾸로 생각하면 누구나 쉽게 뛰어들 수 있었다는 뜻이기도 했어요. 경쟁은 엄청났고요. 창업하기 위해서 전화기만 있으면 된다는 농담도 있었던 시절이기도 하죠. FID의 김지훈 대표도 독특한 이력이 있는 것으로 알고 있어요. 제가 당시에 듣기로는 서울대 출신이고 예체능계도 아닌데 예술에 관심이 생겨서 서울대를 그만두고 예체능으로 변신을 해 미술쪽에서는 최고 명문인 홍익대 산업디자인학과를 들어간 특이한 케이스로 알고 있습니다. 

 

 

나이가 동기들보다 조금 더 많을 수 밖에 없었겠죠. 대학 3학년 때 중소기업진흥공단에서 지원받은 돈을 기초로 해서 창업을해서 5년만에 업체 1위가 되었습니다. 홍익인터넷이 PC통신 인터넷 동호회 사람들을 중심으로 크게 성공한데 비해, FID는 홍익대 산업디자인학과라는 든든한 자원이 있었습니다. 대기업 홈페이지는 프로젝트를 딴 다음에 만드는 것이 상시이고 지금도 당연하죠. 하지만, 본인도 당시 대학생이였고 후배들도 대학생들이였기 때문에 프로젝트를 따기 전에 공부처럼 대기업 홈페이지를 모두 만들어 놓았다고 하더라고요. 

 

그래서 경쟁이 붙었을때 후배들이 만들어 놓은 사이트였기 때문에 다른 회사는 급하게 시안을 만들어 왔는데 FID는 이미 만들어 놓은 시안이 있기 때문에 누구보다 완성도가 높았고, 이미 만들어 놓은 상태였기 때문에 가격도 저렴하게 제안을 해서 당시에는 경쟁자가 없었기에 짧은 시간 내에 1위 업체로 성장할 수 있었던 것으로 알고 있습니다. 그러고, 이때 에이전시 분위기가 바뀌기 시작해요. 홍익인터넷 시절에는 우선 프로젝트는 따고 보는 것이 최고라는 분위기가 있었습니다. 대기업들 홈페이지 다 장악하면 나중에 뭐라도 돈 벌일이 있을 것이라고 생각했거든요. 그런데 좀 전에 이야기 드린 것처럼 이것 때문에 홍익인터넷 같은 회사들에게 위기가 찾아 왔다고 했자나요. FID는 무리한 수주를 하지 않았습니다. 

 

프로젝트 의뢰가 들어와도 추가로 사람을 뽑지 않고 우리는 인력이 없다고 거절했습니다. 그러면서 돈이 되는 프로젝트만 하려고 노력했습니다. 일거리가 줄어들때 생존하기 위한 전략이였죠. 하지만, FID도 몇 년 지나지 않아 점점 어려워지기 시작합니다. 왜냐하면 이때쯤 인터넷 제작 기술이 대중화 되기 시작했거든요. 홍익인터넷이 1위일때만 해도 인터넷 홈페이지 만들수 있는 사람이  정말 극소수였습니다. 

 

 

당시만 해도 신기술이였거든요. 제가 당시에 거의 신입이나 다름 없었는데 한달에 400 정도를 받았어요. 다른 사람보다는 많이 받는 편이긴 했습니다. 그런데 2005년 정도 되니까 더 이상 전문 기술이 아니게 된 것이죠. 그러다보니 웹에이젼시 업체들이 늘어나게 되고 경쟁이 심해지다보니 제작 단가는 떨어지고 그러다보니 FID도 어려워지기 시작했습니다. 2004년 부도가 나게 됩니다. 그때 FID는 범죄와 손을 잡게 됩니다. 소라넷이라고 많은 사람들이 알거라고 생각합니다. 뉴스에 많이 나왔자나요. 우리나라 포르노 사이트의 원조라고 할수 있고 단순 음란물 공유 수준을 넘어 오프라인에 집단 강간 등 다양한 사회적 이슈를 만들어 낸 사이트였는데 이 사이트가 처음에는 개인홈페이지로부터 시작했기 때문에 정말 허접했어요. 

 

그런데 어느 순간 깔끔해졌더라고요. 이 사이트를 일반적인 시장 가격보다 30% 더 받고 만들어 주었던 것이 경찰에 걸린 것이죠. 제작뿐만아니라 수익의 일부분까지 나눠 가졌다는 이야기가 있었는데 그것이 사실인지는 잘 모르겠네요. 리바이스와 웹 에이전시 모두 새롭게 떠오르는 시장을 직접 공략하는 것이 아니라 이 시장을 노리는 회사들에게 서비스를 제공하면서 큰 돈을 벌었지만 우리 모두가 아는것처럼 리바이스는 아직도 세계 최고 자리는 유지하지만 웹에이전시들은 그렇지 않죠. 간혹, 리바이스가 아직도 잘 나가는 브랜드인지 의구심이 있는 분들이 있을 수 있는데 한국에서 리바이스의 인기가 과거에 비해 많이 떨어졌지만 미국에서는 아직도 대중적인 브랜드로 잘 나가고 있다고 합니다. 미국 시장에서 리바이스는 압도적인 1등이라고 하네요. 리바이스와 웹에이전시에 차이는 초기에 시장을 선점하고 잘 나갔지만 후발주자들이 따라오지 못하는 뭔가를 만들었는지 그렇지 못했는지에 대한 차이라고 볼 수 있겠죠. 저는 패션쪽은 잘 모르지만 리바이스는 초창기 광부들이나 입는 옷이라는 선입견을 벗어나기 위해서 디자인에 대한 투자를 상당히 많이 했으며, 워싱도 상당히 다양하다고 합니다. 결국은 이런 것들을 통해서 브랜드 관리를 잘 했다고 봐야겠죠? 그런데, 웹에이전시는 후발주자들의 진입 장벽이 없다보니 가격 경쟁이라는  최악의 상황에 빠지게 되었고 업체가 다들 공멸해서 다들 고만 고만한 업체들만 남게 된 것이죠. 

댓글을 달아 주세요