오픈소스 활용해 코드 생성에 최적화된 대규모언어모델 구축
LG CNS의 LLM과 오픈AI의 GPT 등을 선택해 사용
LG CNS는 코드 생성형 AI에 최적화된 대규모언어모델(Large Language Model, 이하 LLM)을 공개했다고 31일 밝혔다.
LG CNS는 지난해 6월 챗GPT 기반의 코드 생성형 AI 서비스인 ‘AI 코딩’을 개발해 다수의 사내 시스템 운영뿐만 아니라 고객사 SI(System Integration)·SM(System Management) 프로젝트에도 활용 중이다.
LG CNS는 ‘AI 코딩’을 금융·증권사 등 데이터의 외부 유출에 민감한 기업들도 활용할 수 있도록 ‘AI 코딩’의 두뇌 역할을 하는 LLM까지도 자체 개발했다. 고객사들은 각각의 비즈니스 환경에 맞춰 LG CNS의 LLM 또는 오픈AI의 GPT를 선택해 ‘AI 코딩’을 활용할 수 있다.
LG CNS는 메타의 ‘코드라마(CodeLlama)’ 등 다양한 오픈소스 LLM을 활용해 코딩에 최적화된 LLM을 구현했다. 고객사는 보유중인 서버, 클라우드 등 인프라에 LG CNS의 LLM을 설치하고 ‘AI 코딩’을 플러그인 방식(기존 시스템에 부가기능을 추가하는 방식)으로 연결하면 된다. 고객사가 가진 자체 인프라를 활용하기 때문에 소스코드, 개인정보 유출에 대한 고민도 해결한다.
이번에 공개한 LLM과 ‘AI 코딩’을 도입하고자 하는 고객사를 위해 LG CNS는 최적의 프롬프트(Prompt)를 구성하는 컨설팅도 진행한다. 프롬프트는 LLM의 답변 정확도를 높일 수 있도록 질문하는 노하우를 담아 질문을 최적화하는 기능이다.
LG CNS의 프롬프트 엔지니어 등 생성형 AI 전문가들이 코딩 표준, 시스템 개발 환경, 성능 기준 등 고객사의 정보를 담은 프롬프트를 사전 구성함으로써 고객사가 즉시 ‘AI 코딩’을 활용할 수 있도록 한다.
‘AI 코딩’은 시스템, 애플리케이션, 서비스 등을 구축할 때 개발자의 코딩 업무를 지원하는 생성형 AI 서비스다. ‘AI 코딩’은 AI 코딩 오케스트레이터(Orchestrator)와 프롬프트로 구성된다. 오케스트레이터는 LLM이 고객사 데이터를 기반으로 사용자에게 답변하도록 연계해주는 도구다.
여기에는 생성형 AI 서비스 활용의 최대 이슈인 정보 유출 방지 기능도 담겨있다. 예를 들어 금융사의 개발자가 고객의 이름, 생년월일, 자산규모 등 개인정보를 실수로 입력하더라도, 오케스트레이터가 이를 감지하고 마스킹 하는 등 가명정보 처리해 해당 정보가 외부로 유출되지 않도록 하는 식이다.
‘AI 코딩’을 활용하면 개발자의 요구사항에 따라 코드변환, 코드생성, 코드추천, 코드 품질검사 등 다양하게 사용할 수 있다. 코드변환은 과거의 코드를 현재 시스템 버전에 맞는 코드로 변환해주며, 코드생성은 개발자가 자연어로 명령하는 내용에 따라, 기존 코드의 맥락을 분석해 자동으로 코드를 생성해준다.
코드추천을 활용하면 코드 작성 과정에서 다음 단계에 작성할 코드를 미리 추천받을 수 있고, 코드 품질검사를 통해 오류를 발생시키는 부분 등을 탐지, 자동으로 수정된 코드를 확인할 수도 있다.
LG CNS는 지난 30여년간 금융, 물류, 제조 등 각종 산업에서 디지털전환(DX)을 수행한 코딩 노하우를 담아 ‘AI 코딩’의 고도화를 준비 중이다.
김선정 LG CNS CTO 전무는 “고객사가 보유한 인프라 환경에도 설치해 사용할 수 있도록 AI 코딩에 최적화된 LLM을 확보했다”며 “AI 코딩을 통해 고객사가 디지털 서비스의 개발 생산성을 혁신할 수 있도록 할 것”이라고 강조했다.
댓글0