카테고리 없음

인공지능 최신 기술_연합학습 (2편)

doimoi 2022. 7. 2. 20:00

이제 본격적으로 연합학습에 대해서 이야기 해 볼께요. 연합학습은1편에서 이야기 드린 것처럼 요즘은 흩어지는 것이 추세라고 했는데 인공지능에 흩어지는 추세를 반영한 것이라고 보면 됩니다. 인공지능을 개발하기 위해서는 최소 수백만개 이상의 데이터가 필요한데 그러기 위해서 개인이 생성한 자료를 중앙 서버에 올려서 분석해야 했습니다. 그런데, 클라우드의 단점처럼 수 많은 자료를 서버에 보내면 분석하기는 좋은데 똑같은 문제점이 생깁니다. 나의 개인정보가 모두 중앙 서버에 모이는 것을 좋아하지 않는 사람들이 생깁니다. 당연한 이야기겠죠. 또한, 중앙서버를 운영하는 입장에서도 서버 비용과 네트워크 비용이 계속 올라 갈 수 밖에 없는 것이지요. 올리는 사람도 불만이 있고, 받는 사람도 부담이 커지는 상황이 된 것입니다. 그래서, 구글에서 요즘 추세를 반영해서 나온 기술이 연합학습입니다. 예를들어서 쉽게 설명 드리면 이렇게 이야기 드릴 수가 있습니다. 간단한 것은 스마트폰에서 처리하고, 처리한 결과를 정리해서 복잡하거나 큰 모델은 중앙에서 다시 정리하는 모델입니다.  예를들어서, 핸드폰에서 기본적인 노이즈를 제외하거나 개인정보를 제외하거나 간단한 필터링을 한다던가 등의 작업을 할 수 있습니다. 그러고 이렇게 1차적으로 가공된 정보를 중앙에서 처리하면 개인정보 이슈도 줄어 들수 있고, 전송하는 데이터도 적고 보관해야 하는 정보도 적기 때문에 장점이 있지요.

또 다른 장점으로는 시대적인 요구에 부합한다는 점입니다. 요즘 세계적으로 개인정보에 대한 관심이 크게 늘어나고 있습니다. 대표적으로 GDPR들수 있습니다. GDPRGeneral Data Protection Regulation의 약어 입니다. 유럽 의회에서 유럽 시민들의 개인정보 보호를 강화하기 위해 만든 통합 규정인데요. 나로부터 생성된 개인정보는 내 것이라는 규정이라고 할 수 있는데요. 이것이 뭔 소리이지? 라고 생각하실 수 있습니다. 쉽게 이야기하면 내가 페이스북을 이용하고 있다고 생각해 봅시다. 내 정보라고 해도 페이스북이 나에 대한 정보를 나에게 주지는 않지요. 현재는 아무리 나의 정보라고 해도 내 정보가 어떻게 관리되고 있는지도 모릅니다. 나와 관련 된 정보를 모두 삭제 해 달라고해도 안 해 주는 경우도 많지요. 삭제해 주겠다고해도 정말 해 주었는지 알수도 없고요. 지금 이야기 드린 것을 법으로 정해 요청이 있을 경우 개인정보의 주인은 나이기 때문에 나의 요청을 들어 주는 것이라고 생각하시면 됩니다. 우리나라도 GDPR에 관심이 많습니다. 그래서, 개인정보 관련 법을 이야기할때 GDPR는 꼭 참고의 대상이 되고 있습니다.

우리가 인공지능에  대해서 기대하는 것이 무엇인가요? 가장 먼저 생각나는 것은 편리함이겠지요. 편리함은 기본적으로 인간이 할수 있는 것을 편하게 해 주는 것이지요. 하지만, 인간이 하기 어려운 것을 했을때 인공지능이 더 가치가 있을 것입니다. 그러고, 그것이 놀이나 재미가 아닌 근원적인 분야일 것이 더 가치가 있겠지요. 지금은 언론에 관심에서 멀어져서 우리들의 관심에서도 멀어졌지만 불과 3~4년 전만해도 큰 주목을 받았던 인공지능이 있습니다. 바로 인공지능 의사인 왓슨입니다. 지금은 왓슨에 대해서 다들 조용하지요. 그때는 인간의사를 조만간 대처할 것처럼 기대로 많고, 병에 대한 판독률이 인간 의사랑 70% 비슷하다는 뉴스로 큰 관심을 받았습니다. 당시에도 인간 의사도 쉽게 판독할수 있는 병을 인공지능 의사인 왓슨도 비슷하게 판독한다는 것으로 많은 사람들이 열광했는데 문제는 실제 병원에서는 큰 도움이 안 된다는 문제점이 있었습니다. 하지만, 조만간 기술이 크게 발달해서 인간 의사가 판단하지 못하는 다양한 병을 판단할  수 있게 도와 줄 것이라고 생각했는데 그렇지 못하고 있는 상황입니다.

가장 큰 문제는 개인정보 때문입니다. 인간 의사가 잘 판단하지 못하는 특이한 병을 인공지능 의사가 판단하기 위해서는 병에 걸린 사람의 신체 정보를 수백만개 모아서 분석해야 하지요. 그러기 위해서는 병원에서 가지고 있는 환자의 모든 정보를 중앙 서버에 모두 보내야 가능한 것인데 매우 민감할 수 밖에 없습니다. 그렇기 때문에 데이터를 모으기 쉽지  않았습니다. 전문가들은 이것을 해결할 수 있는 방법이 연합학습이라고 보는 것입니다.  개인정보를 모두 서버에 넘기지 않고 1차적으로 단말에서 분석한 정보만 넘기기 때문에 개인정보를 보호할 수 있다는 장점이 있습니다. 이런 이유는 국내외 막론하고 연학학습에 가장 관심을 가지는 분야는 병원, 헬스 분야 쪽이라고 보시면 될 거 같습니다.