책 리뷰 / / 2022. 11. 4. 17:00

비전공자도 이해할 수 있는 AI지식

반응형

비전공자도 이애할 수 있는 AI지식
지은이 : 박상길

AI지식을 활용한 다양한 기술들을 살펴본다.

AI를 활용한 기술들의 역사와 원리를 설명해 주는 책입니다. 자연스럽게 우리가 사용하고 있는 컴퓨터란 마법 도구를 공부하면 이해 할 수 있는 것처럼 AI를 이해 가능한 과학으로 만드는 첫 걸음으로 읽기에 좋은 책이라고 봅니다. 이 책이 가진 가장 큰 장점은 그림입니다. 보다 쉽게 이해할 수 있게 해주어 글로만 읽는 것보다 이해하기 쉬웠습니다. 인공지능, 자율주행, 검색 엔진, 스마트 스피커, 기계번역, 챗봇, 네비게이션, 추천 알고리즘에 대해 설명해줍니다. 스마트 스피커를 제외하면 평소에 자주 사용하는 것들이기에 흥미롭게 읽었습니다. 읽어보니 현재 AI의 한계가 생각보다 명확했습니다. 잘 모르기에 두려울 수 있는 AI를 잘 이해해 두면 두려워할 필요는 없다고 생각됩니다.

 

주변에서 볼 수 있는 AI기술들

1956년 처음으로 인공지능이란 용어를 사용하게 되었습니다. 그리고 1958년 퍼셉트론이라는 초기 인공신경망의 등장하게 됩니다. 퍼셉트론은 데이터를 받는 수용층, 특정 알고리즘을 적용해 전달하는 연합층, 최종 출력을 나타내는 반응층으로 이루어져 있습니다. 이처럼 알고리즘과 데이터를 넣으면 정답이 나오는 초기 인공신경망 구조에서 데이터와 정답을 입력하면 알고리즘을 알아내는 머신 러닝, 많은 데이터와 정답을 입력하면 다양한 알고리즘을 찾아내는 딥러닝 순서로 개발이 진행됬습니다. 그리고 많은 데이터는 인공지능의 성공률을 굉장히 많이 높여주기에 빅데이터 기술의 중요성 또한 커지게 됩니다.

 

현재 많이 사용하는 딥러닝 단계에서도 전체의 수를 계산하는게 아니라 확률화로 승률을 높이는 방식으로 체스,바둑,장기 등 각각 다른 특정한 장르에서의 승리만 가능한 상황입니다. 인공지능의 한계가 아직은 명확합니다.

 

자율주행 차량은 현재 확률을 업데이트 하면서 주행하는 자율 주행차와 컨볼루션 신경망이라는 사용한 특정 이미지를 가장 근접한 대상으로 인식하는 기술을 사용해 운용되고 있습니다.

운송업이 우리에게 주는 영향력과 같게 자율주행 차량이 주게 될 다양한 산업군을 향한 영향은 막대할 것이라 예상됩니다. 완전 자율주행 차량이 되기까지는 아직 기술적 문제가 남아있고 거기에 더해 상용화 할 때 긴급상황시 수동운전이 불가능하게 되거나 도덕적 문제가 발생하는 상황에서의 해결 방법이 완벽하지 않습니다.

 

검색엔진은 구글의 분산파일 시스템인 GFS 문서를 활용해서 만들어졌습니다. 처음에 크롤러가 url에 들어가 해당 웹페이지의 모든 링크를 식별해 대기 목록에 추가시킵니다. 그와 동시에 필요한 내용을 저장하면서 한 번 방문한 사이트를 다시 방문하지 않게 스케줄러가 관리를 합니다. 크롤러는 색인을 만들어 검색에 적합하게 만드는 용도로 사용되며 이 과정을 거쳐 색인 생성이 완료되면 검색어와 관련된 페이지를 노출시키게 되는데 여기서 한 번 더 스팸을 걸러내기 위한 랭킹 시스템을 거치게 됩니다.

랭킹 시스템은 최신 문서, 품질이 좋은 문서, 인용 횟수, 제목에 맞는 문서, 본문, 근접도, TF-IDF 알고리즘, BM25 등 한 두 가지 조건이 아닌 종합적인 면으로 판단됩니다. 최종적으로 a/b 실전테스트를 통해 검색 엔진을 보완해 나갑니다.

 

스마트 스피커는 현재 문제 해결용 대화 시스템으로 활용되고 있습니다. 대화라는 건 표정, 상황, 손짓, 얼굴 표정, 주변 소리 등 복합적인 요인이 영향을 주는 행위이고 음성만으로 알아듣는 건 사람에게도 어려운 일입니다.

여기서도 확률이 사용됩니다. 각 단어의 파형의 가능성을 인식시키는 방법으로 음성 빅데이터를 활용해 음성의 파형을 인식하는 음향 모델을 만듭니다. 여기에 언어 모델을 더해 앞뒤 상황에 맞는 단어를 확률로 산출해 파악합니다.

문장을 파악했으면 다양한 의미로 상요되고 있는 단어들을 정확하게 해석하기 위해 자연어 이해를 시켜야 합니다. 문장을 카테고리로 나누는 도메인 분류, 의도를 파악하기 위해 의도별로 나누는 인텐트 분류, 누락된 정보를 채워주는 슬롯 필링, 정확한 정보 파악을 위한 추가 질문 멀티 턴을 활용합니다. 그 후 다이얼로그 매니저가 인터넷에 있는 정보를 가져와서 음편 선택 합성 기술을 활용해 자연스러운 문장을 만들어 대답합니다.

 

기계 번역은 2016년 구글이 인공 신경망을 도입하면서 번역 품질이 엄청나게 향상됬습니다. 많은 데이터를 활용해 자연스럽게 번역하면서 중요한 부분을 지정해두는 어텐션 또한 활용해 길이가 길어지더라도 자연스럽게 번역을 가능하게 만들었습니다.

 

챗봇은 단어를 숫자로 표현해 해석시켜 기하학의 형태로 질문의 유사도를 측정합니다. 유사도 측정을 토대로 질문의 대답을 생성하면 높은 확률로 맞는 대답의 위치를 찾아내 전송하게 되는 겁니다.

 

네비게이션은 정체 구간을 찾기 위한 알고리즘과 최단 구간을 찾기 위한 알고리즘을 사용합니다. 두 알고리즘 다 모든 경우의 수를 계산하는 게 아닌 높은 확률을 가진 경우의 수만을 계산하여 빠르게 계산을 해 결과를 보여주는 식의 알고리즘을 사용합니다.

 

마트나 인터넷 쇼핑에서의 추천 알고리즘은 연관성을 분석해 추천을 해주며 유튜브의 추천 알고리즘은 특징을 뽑아내 점수를 매기는 방식과 비슷한 성향의 사람과 매칭시켜 추천하는 방식으로 이루어집니다. 넷플릭스나 영화 등 평점 정보를 기반해 특징을 나눠 이를 숫자로 표현해 인수분해한 점수로 나타내는 경우도 있습니다.

추천 시스템은 특징 값이 많아지면 많아질수록 같은 성능을 내려면 많은 데이터가 필요하게 됩니다. 데이터가 부족하다면 특징 개수를 줄여야 하고 특징 개수가 너무 많으면 너무나 똑같은 취향의 작품만 추천이 되니 적당한 양을 유지하는 게 중요합니다.

AI는 이미 너무 중요하다.

AI를 활용한 기업들은 엄청난 돈을 벌어들이고 있으며 현재 발전하고 있는 기술들을 살펴보면 전체적으로 AI가 적용되고 있는 과정 중이란 걸 알 수 있습니다. AI를 알지 못한다는 건 자동차,컴퓨터,스마트폰,다양한 버튼이 있는 기계들을 사용하지 못한다는 것과 마찬가지 입니다. 너무 많은 기술과 합쳐지고 있고 실제로 효율적입니다. 이러한 AI기술을 잘 배워두는 건 현재 우리가 사용하고 있는 걸 좀 더 깊게 이해하고 제대로 사용하기 위해 필수라고 생각되니 입문서로 한 번 읽어보는 걸 추천드립니다.

반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유