주요 메뉴 바로가기 (상단) 본문 컨텐츠 바로가기 주요 메뉴 바로가기 (하단)

테크 이지 토크 첫 번째, ‘LLM’은 교육 분야에 어떤 변화를 가져오고 있나?

테크42 조회수  

최호식 시립대 도시빅데이터융합학과 교수, ‘개인정보보호가 가능한 상황 내 LLM활용 학습방법’
송경우 연세대 응용통계학과 교수, ‘신뢰가능한 대형언어모델을 위한 최근 기술 동향과 교육 콘텐츠 활용 방향’
자체 교육 특화 대형언어모델, 라마 3 기반 ‘라마 3-에듀’… 문제 유형과 요지, 문장의 흐름 파악 할 수 있어
(왼쪽부터) 최호식 시립대 도시빅데이터융합학과/인공지능학과 교수, 송경우 연세대 응용통계학과 교수. (사진=테크42)

산업 각 분야에서 초거대언어모델(LLM, Large Language Model)을 활용한 기술과 서비스가 앞다퉈 등장하고 있다. 과연 LLM의 강점과 한계는 무엇일까? 그리고 여러 분야 중 특히 교육 분야에 미칠 영향은 어떨까?

30일 LLM을 둘러싼 다양한 질문을 가지고 관련 업계 전문가, 기업인들과 함께 소통하는 ‘테크 이지 토크(Tech easy talk)’ 첫 번째 행사가 연세대학교 캠퍼스에서 열렸다.

오후 3시부터 진행된 첫 번째 ‘테크 이지 토크’ 주제는 ‘LLM의 미래: 신뢰할 수 있는 대형언어모델(LLM)과 교육에 가져올 변화의 바람’이다.

‘LLM의 미래: 신뢰할 수 있는 대형언어모델(LLM)과 교육에 가져올 변화의 바람’을 주제로 연세대에서 첫 번째로 진행된 ‘테크 이지 토크’ 현장. (사진=테크42)

이번 행사 패널로는 송경우 연세대학교 응용통계학과 교수, 최호식 시립대학교 도시빅데이터융합학과 교수가 나섰다.

송 교수는 카이스트 산업공학 박사 출신으로 네이버 클로바 방문연구원, 시립대 인공지능학과 조교수를 거쳐 현재 연세대학교 응용통계학과와 통계데이터사이언스학과 조교수로 근무하고 있다. 최근 3년간 NeurIPS, ICML, AAAI, KDD, CVPR 등 AI 탑 컨퍼런스에 12편의 논문을 게재하며 주목을 받고 있다. 현재는 에듀테크 기업 북아이피스와 산학협력 프로젝트를 진행하는 한편, 자체 교육 특화 대형언어모델을 개발하며 교육 분야의 LLM(거대언어모델) 접목을 시도하고 있다.  

호식 교수와 송경우 교수는 에듀테크 기업 북아이피스의 콘텐츠 라이선싱 플랫폼 ‘쏠북’의 기능 고도화를 위한 산학협력 프로젝트를 진행하고 있다. (이미지=북아이피스)

최호식 교수의 경우는 서울대 통계학 박사 출신으로 호서대와 경기대를 거쳐 현재는 서울시립대학교 도시과학빅데이터AI연구원 개인정보보호센터장과 한국자료분석학회 학술위원장을 비롯해 일반대학원 도시빅데이터융합학과와 인공지능학과 교수로 근무하고 있다. 특히 최 교수는 교육콘텐츠 IP 라이선싱 플랫폼 고도화를 위한 컴포넌트 단위 콘텐츠 관계성 분석 AI 기술 과제를 비롯해 다양한 산학협력, 정부 과제를 수행 중이다.

이날 ‘개인정보보호가 가능한 상황 내 LLM 활용 학습방법’을 주제로 발표에 나선 최 교수는 다양한 프롬프트 예제를 통해 연구 내용을 설명하는 한편, 인컨텍스트 러닝을 신호 데이터에 적용하는 연구 내용에 대헤서도 소개하는 시간을 가졌다. (사진=테크42)

이날 ‘개인정보보호가 가능한 상황 내 LLM 활용 학습방법’을 주제로 발표에 나선 최 교수는 “최근 LLM은 산업적으로 광범위하게 활용되고 있지만, 사실 프라이버시 이슈가 있다”며 “익명화 가명화한 프롬프트 적용, 암호화 방안에 대해 연구 중”이라고 운을 뗐다.

“어떤 문제가 주어지면 그 문제에 대한 독창성을 누가 보호할 것인가의 문제가 생깁니다. 가령 학원에서 출제한 문제가 있다면, 이를 접한 사람들을 통해 문제가 재생산될 수 있죠. 원작자의 고유한 참신성이 다듬어 지면서 좋은 문제로 발전할 수 있지만, 그 고유한 아이디어는 귄리를 보호받지 못한다는 생각이 듭니다. 그래서 이런 문제가 들어오면 현재 트랜스포머 등 굉장히 다양하게 개발된 기술을 통해 문장들을 백터 형태로 표현하고 암호화하는 원리 입니다.”

이어 최 교수는 다양한 프롬프트 예제를 통해 연구 내용을 설명하는 한편, 인컨텍스트 러닝을 신호 데이터에 적용하는 연구 내용에 대헤서도 소개하는 시간을 가졌다. 이는 사람의 뇌파 신호 측정을 통해 텍스트로 전송하는 기술로 ‘상상 발화(bioelectrical signal to text)’라 불리는 BCI(bio computer interface, BCI) 기술이다. 최 교수는 “이 기술 역시 프라이버시 이슈가 있다”며 최근 연구 동향을 설명하기도 했다.

‘상상 발화(bioelectrical signal to text)’라 불리는 BCI(bio computer interface, BCI) 기술은 뇌파 신호를 측정해 텍스트화한다. (이미지=최호식 교수 자료)

‘신뢰가능한 대형언어모델을 위한 최근 기술 동향 소개 및 교육 컨텐츠 분석’을 주제로 두 번째 발표에 나선 송경우 교수는 “시립대 학생들과 최호식 교수님, 연세대 학생들이 함께한 연구”라고 소개하며 말을 이어갔다.

이날 송 교수는 대형언어모델의 원리와 최근 활용 분야에 대한 동향을 간단하게 언급한 후 ‘대형언어모델 기반 Document 질의응답’ ‘대형언어모델과 교육컨텐츠 관계 분석’ ‘자체 교육 특화 대형언어모델 개발’ 등의 내용으로 발표를 진행했다.

특히 ‘대형언어모델 기반 Document 질의응답’ 파트에서 송 교수는 “문서에 기반해 LLM이 답 해주기를 원하는 것”이라며 “한번에 요청을 하는 것이 아닌 스텝 바이 스텝으로 요청을 하게 된다”고 설명하며 전체 방법론을 소개했다.

이날 송 교수는 대형언어모델의 원리와 최근 활용 분야에 대한 동향을 간단하게 언급한 후 ‘대형언어모델 기반 Document 질의응답’ ‘대형언어모델과 교육컨텐츠 관계 분석’ ‘자체 교육 특화 대형언어모델 개발’ 등의 내용으로 발표를 진행했다. (사진=테크42)

이는 질문과 문서의 유사도를 측정하는 ‘TF-IDF’를 시작으로 각 LLM 요청 단계를 통해 진행된다. 이 각각의 단계는 질문과 문단의 관련 여부를 판단하는 ‘Associative Selection’을 거쳐 다시 문단이 질문에 답 가능 여부를 판단하고 가능할 시 근거를 생성하는 ‘Rationale Generation’로 이어진다. ‘Systematic Composition’는 앞선 결과를 토대로 종합적인 답을 도출하는 과정이다.

대형언어모델 기반 Document 질의응답 프로세스. (이미지=송경우 교수 자료)

“일단 질문이 들어오면 그 질문에 있는 키워드와 도큐먼트는 굉장히 길겠죠. 그러면 수백 페이지의 도큐먼트에서 그 키워드와 관련이 있는 파트만 가져오게 됩니다. 다음으로는 물어보는 거죠. 여기까지는 아직 언어모델은 아니지만, ‘TF-IDF’를 통해 과거에 많이 쓰였던 키워드 기반으로 질문의 키워드, 문서의 키워드를 비교하고 1차로 필터링을 하는 과정입니다. 다음으로 LLM에게 ‘GPT야 너도 그렇게 생각해’라고 물어보는 거예요. 이후에는 언어모델이 ‘Yes’라고 답한 것만 가져와서 왜 그렇게 말한 것인지 근거를 물어보고 그 근거를 토대로 최종적인 질문에 대한 답을 다시 요청하는 겁니다.”

한편 이날 송 교수는 대형언어모델을 통한 학습자료와 교과 자료 관계성을 분석하는 연구 소개와 함께 메타의 라마 3(LlaMA 3)를 기반으로 개발한 ‘라마3-에듀(LlaMa3-Edu)’를 소개하기도 했다.

이날 송 교수는 대형언어모델을 통한 학습자료와 교과 자료 관계성을 분석하는 연구 소개와 함께 메타의 라마 3(LlaMA 3)를 기반으로 개발한 ‘라마3-에듀(LlaMa3-Edu)’를 소개하기도 했다. (이미지=송경우 교수 자료)

“GPT-4 옴니의 경우 딱 결과문만 제시하고 각 결과물의 토큰에 대한 확률값을 굉장히 제한적으로 보여주는 등의 제약이 있기 때문에 자체적인 교육 특화 대형언어모델을 만드는 것이 필요하다고 생각했습니다. 때 마침 약 80억개정도의 파라미터를 가지고 있는 ‘라마3’가 공개됐죠. 특별한 경우 외에 상업적으로도 이용이 가능한 모델이라는 장점도 있었고요. 또 이를 잘 트레이닝 시켜 GPT-4와 유사한 정도의 성능을 내도록하는 라마3 변형 모델들이 공개되기도 했죠. 저희 역시 이와 유사하게 라마 3를 가져와 교육 콘텐츠의 데이터에 대해 추가 학습을 시키면 특정 테스크에서는 GPT-4에 버금갈 수 있는 모델을 만들 수 있을 것이라고 판단했습니다. 그리고 북아이피스, 시립대와 함께 만든 데이터베이스를 이용해 insturction data를 만들었습니다. 쉽게 말해 라마 3를 추가 학습 시키기 위한 데이터를 만든 것이죠. 현재는 기존 라마 3보다 정말 성능이 좋은 것인지 검증을 하고 있는 상황입니다.”

송 교수에 따르면 이 ‘라마3-에듀’는 특정 교육 콘텐츠(문제)에 대해 질문 유형을 파악하고 바른 조합을 찾아 문제 요지를 파악하는 결과를 내고 있다. 또 문장의 흐름을 이해해 정답을 도출하는 결과도 얻은 상황이다.

이날 발표 이후 진행된 ‘네트워킹’ 시간에는 두 교수의 발표 내용과 관련해 LLM 기술 기반 비즈니스를 고민하는 기업 관계자를 비롯해 참석자들의 질문이 이어지며 열기를 더해갔다.

한편 이날 ‘테크 이지 토크’에 함께한 북아이피스 이경재 이사는 “GPT를 비롯해 다양한 기술들이 등장하고 있지만, 신뢰할 수 없다면 교육 분야에 콘텐츠에 적용하는 것은 아무 소용이 없다”며 “신뢰성을 검증하고 결과를 만들어 주는 언어모델이 저희에게 굉장히 필요한데, 절묘한 타이밍으로 ‘라마3-에듀’에 대한 발표를 듣게 돼 빨리 도입할 방안을 마련해야겠다는 생각을 했다”고 소감을 밝혔다.

테크42
content@www.newsbell.co.kr

댓글0

300

댓글0

[차·테크] 랭킹 뉴스

  • 디자이너·개발자가 말한 ‘아이오닉 9’의 매력
  • [게임브리핑] 슈퍼바이브, 국내 오픈 베타 테스트 첫선 외
  • 현대차 ‘아이오닉9’ 첫 공개… 소개나선 무뇨스, CEO 공식 데뷔
  • 위메이드 석훈 PD "레전드 오브 이미르 시즌은 이렇게 다르다"
  • EV9 사려다 “마음 바꿨다”… 무려 532km 주행 가능한 대형 전기 SUV
  • "블루 아카 같네", "OST 기대 이상" '테일즈런너 RPG' OST 및 전투 화면 영상 반응

[차·테크] 공감 뉴스

  • “레토나 감성인데 8천만 원대?”…더 강력해진 이 車, 대체 정체가 뭐길래
  • ‘7년 차’ 구광모의 2025년 인사 키워드는 ‘안정 속 ‘ABC’ 준비 속도’
  • ‘K콘텐츠 애정공세’ 디즈니… “더 화려한 배우진과 색다른 소재로” (종합)
  • DOA 말고 '데이트 어 라이브'....'에버소울'과 '그랑사가 키우기' 콜라보
  • [금주의 게임 순위] '라스트 워' 매출 1위 10일간 지속...스토커2·루마섬 순위 진입
  • 한국산 배터리에 도전장 놓더니 “겨울인데 배터리가 쌩쌩?”…업계 ‘초긴장’

당신을 위한 인기글

  • 푹- 끓여내어 야들야들한 건더기와 얼큰한 국물의 만남, 육개장 맛집 BEST5
  • 한식에 술만 있다면 무한으로 마실 수 있는 술꾼이 인정한 한식주점 5곳
  • 찬바람에 몸이 으슬으슬 떨리는 지금, 딱 좋은 감자탕 맛집 BEST5
  • 본격적인 겨울의 시작을 알리는 굴 맛집 BEST5
  • [리뷰: 포테이토 지수 72%] ‘위키드’ 중력을 거스르지 못한 완성도
  • ‘짝퉁 제왕’ 되는 김수현 “로맨스는 15%뿐”
  • 전지현·현빈·김수현·박은빈·도경수까지, 디즈니+ 빛낼 새 얼굴은?
  • [데일리 핫이슈] 로제·브루노 마스 ‘아파트’ 첫 라이브, 고현정 ‘유퀴즈’ 출격

함께 보면 좋은 뉴스

  • 1
    대표팀에서도 사고친 벤탄쿠르, A매치 출전 금지 징계는 끝…'우아한 축구' 우루과이 자찬

    스포츠 

  • 2
    세계테마기행 인도네시아 4부, 반둥 편

    연예 

  • 3
    ‘눈치 좀 그만봐’… 한국 축구 사령탑 홍명보, 이천수 주장에 단호히 반박했다

    스포츠 

  • 4
    대한항공, 한국전력 완파…선두 현대캐피탈과 승점 격차 해소

    스포츠 

  • 5
    "저만 잘하면 될 거 같습니다" 선발 복귀하고 3연승, 그럼에도 한선수는 자책했다 왜 [MD인천]

    스포츠 

[차·테크] 인기 뉴스

  • 디자이너·개발자가 말한 ‘아이오닉 9’의 매력
  • [게임브리핑] 슈퍼바이브, 국내 오픈 베타 테스트 첫선 외
  • 현대차 ‘아이오닉9’ 첫 공개… 소개나선 무뇨스, CEO 공식 데뷔
  • 위메이드 석훈 PD "레전드 오브 이미르 시즌은 이렇게 다르다"
  • EV9 사려다 “마음 바꿨다”… 무려 532km 주행 가능한 대형 전기 SUV
  • "블루 아카 같네", "OST 기대 이상" '테일즈런너 RPG' OST 및 전투 화면 영상 반응

지금 뜨는 뉴스

  • 1
    'KKKKKKKK' 타카하시 158km 괴력투+코조노 2홈런 7타점…'우승 후보' 日, 미국 9-1 완파 [프리미어12]

    스포츠 

  • 2
    ‘공학전환’ 논의 잠정 중단한 동덕여대: 본관 점거는 계속하는 분명한 이유가 있었다

    뉴스 

  • 3
    “대통령의 오만을 언론의 무례로 둔갑시킨 尹정권”

    뉴스 

  • 4
    홍명보 감독, 김민재 실수에 대한 자신의 책임 인정

    스포츠 

  • 5
    대체 외인 선수가 팀 성적에 미치는 영향, 대한항공과 한국전력의 극명한 대조

    스포츠 

[차·테크] 추천 뉴스

  • “레토나 감성인데 8천만 원대?”…더 강력해진 이 車, 대체 정체가 뭐길래
  • ‘7년 차’ 구광모의 2025년 인사 키워드는 ‘안정 속 ‘ABC’ 준비 속도’
  • ‘K콘텐츠 애정공세’ 디즈니… “더 화려한 배우진과 색다른 소재로” (종합)
  • DOA 말고 '데이트 어 라이브'....'에버소울'과 '그랑사가 키우기' 콜라보
  • [금주의 게임 순위] '라스트 워' 매출 1위 10일간 지속...스토커2·루마섬 순위 진입
  • 한국산 배터리에 도전장 놓더니 “겨울인데 배터리가 쌩쌩?”…업계 ‘초긴장’

당신을 위한 인기글

  • 푹- 끓여내어 야들야들한 건더기와 얼큰한 국물의 만남, 육개장 맛집 BEST5
  • 한식에 술만 있다면 무한으로 마실 수 있는 술꾼이 인정한 한식주점 5곳
  • 찬바람에 몸이 으슬으슬 떨리는 지금, 딱 좋은 감자탕 맛집 BEST5
  • 본격적인 겨울의 시작을 알리는 굴 맛집 BEST5
  • [리뷰: 포테이토 지수 72%] ‘위키드’ 중력을 거스르지 못한 완성도
  • ‘짝퉁 제왕’ 되는 김수현 “로맨스는 15%뿐”
  • 전지현·현빈·김수현·박은빈·도경수까지, 디즈니+ 빛낼 새 얼굴은?
  • [데일리 핫이슈] 로제·브루노 마스 ‘아파트’ 첫 라이브, 고현정 ‘유퀴즈’ 출격

추천 뉴스

  • 1
    대표팀에서도 사고친 벤탄쿠르, A매치 출전 금지 징계는 끝…'우아한 축구' 우루과이 자찬

    스포츠 

  • 2
    세계테마기행 인도네시아 4부, 반둥 편

    연예 

  • 3
    ‘눈치 좀 그만봐’… 한국 축구 사령탑 홍명보, 이천수 주장에 단호히 반박했다

    스포츠 

  • 4
    대한항공, 한국전력 완파…선두 현대캐피탈과 승점 격차 해소

    스포츠 

  • 5
    "저만 잘하면 될 거 같습니다" 선발 복귀하고 3연승, 그럼에도 한선수는 자책했다 왜 [MD인천]

    스포츠 

지금 뜨는 뉴스

  • 1
    'KKKKKKKK' 타카하시 158km 괴력투+코조노 2홈런 7타점…'우승 후보' 日, 미국 9-1 완파 [프리미어12]

    스포츠 

  • 2
    ‘공학전환’ 논의 잠정 중단한 동덕여대: 본관 점거는 계속하는 분명한 이유가 있었다

    뉴스 

  • 3
    “대통령의 오만을 언론의 무례로 둔갑시킨 尹정권”

    뉴스 

  • 4
    홍명보 감독, 김민재 실수에 대한 자신의 책임 인정

    스포츠 

  • 5
    대체 외인 선수가 팀 성적에 미치는 영향, 대한항공과 한국전력의 극명한 대조

    스포츠 

공유하기