GPT-4를 활용한 인공지능 앱 개발 – 책소개

🗓️

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

  • 원제 : Developing Apps with GPT-4 and ChatGPT
  • 저자 : Caelen, Olivier, Blete, Marie-Alice
  • 출간 : O’Reilly Media, 2023 / 한빛미디어, 2023

ChatGPT 가 이 세상에 등장한지 1년이 됐다. 나도 GPT3.5 첫 출시때부터 사용하기 시작해 지금은 글이나 코드를 작성하는데 도와주는 비서로 많이 활용하고 있다. 이번 책은 GPT모델을 이용해 어플리케이션에 어떻게 접목하는지 상세하게 소개한다.

GPT 모델을 본격 사용하기 전에 책에서는 자연어 처리 NLP 와 대규모 언어 모델 LLM 에 대해서 먼저 설명해준다. NLP란 컴퓨터가 사람의 자연어를 처리하고 해석하고 생성하도록 하는데 초점을 맞춘 AI 의 세부 분야다. LLM은 텍스트 처리 작업을 할 수 있는 ML 모델이다. LLM은 세간에 알려진대로 방대한 양의 데이터를 분석하거나 학습하여 문장을 분석한다. 그리고 GPT는 텍스트 생성 작업에 탁월한 최신 LLM 이다. 또한 LLM 의 고질적인 문제인 할루시네이션에 대한 설명도 한다. 요약하자면 LLM 은 방대한 데이터에서 정답과 비슷해 보이는 것을 응답할 뿐이지 정답을 내놓지 않는다는 것이다. GPT 역시 마찬가지 이므로 정확성을 요구하는 분야에서는 생성한 정보에 대해 검증할 수 있어야 한다고 한다.

다음으로는 이제 GPT로 어플리케이션을 만들기 위해 필요한 API 이용방법과 과금 방식, 그리고 간단한 파이썬 어플리케이션을 지나 프롬프트 엔지니어링과 튜닝 기법으로 들어간다. 프롬프트 엔지니어링도 프로그래밍의 방식중 하나로써 LLM이 최대한 적합한 출력을 생성할 수 있도록 최적의 입력형태와 사례를 개발하는데 중점을 둔 분야다. 프롬프트는 크게 역할, 컨텍스트, 작업 세가지 부분으로 나뉘는데, 역할은 말 그대로 모델이 역할을 부여해서 출력에 영향을 주는 기법이다. 컨텍스트는 말 그대로 원하는 답을 얻기 위한 사용자의 요청이다. 작업은 결과물을 원하는 형태로 표시되게끔 하는 최종 처리단계다. 파인 튜닝에 대한 이야기도 나온다. 파인 튜닝이란 LLM 이 있을때 여기에 특정 도메인의 데이터를 가지고 튜닝된 새로운 모델을 만드는 기법을 말한다. 아울러 프롬프트 인젝션은 언제나 가능한 부분이고, API 키 역시 노출에 조심해야 한다고 친절하게 알려준다.

앞서 LLM 은 GPT4가 되었더라도 여전히 할루시네이션에 대한 우려가 있다고 했는데 이를 해결하기 위해 랭체인 플러그인이라는 도구로 할루시네이션의 단점을 해결할수 있다고 안내한다. 이를태면 2 x 2 에 대한 답을 4로 내놓는것은 GPT가 수식을 계산해서가 아니다. 주어진 수식에 대한 답을 데이터셋에서 봤기 때문에 4라고 대답하는 것이다. 이것에 대한 정확도를 높히기 위해 랭체인 플러그인을 사용하는것이다. 계산기와 관련된 랭체인을 사용하면 2 x 2를 직접 계산하여 정확도를 높혀줄 것이고, 위키페디아 랭체인을 사용하면 요청 중 원하는 키워드에서 위키페디아를 직접 검색하게 할 수도 있다.

평소 ChatGPT를 잘 사용하는 프로그래머면서 직접 API로 만들어 볼 생각은 했지만 토큰개념이나 과금 체계를 잘 몰라서 시행착오를 격을까 했는데 좋은 가이드 책을 접하게 되었다. 파이썬 라이브러리가 어렵게 구현된 것처럼 보이지는 않아 자바로도 백엔드를 간단하게 만들 수 있지 않을까 기대한다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.