• 제목/요약/키워드: Naver

검색결과 664건 처리시간 0.024초

Span Matrix를 이용한 다중 범위 추출 기계독해 시스템 (Machine Reading Comprehension System for Multiple Span Extraction using Span Matrix)

  • 장영진;이현구;신동욱;박찬훈;강인호;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-35
    • /
    • 2021
  • 기계독해 시스템은 주어진 질문에 대한 답변을 문서에서 찾아 사용자에게 제공해주는 질의응답 작업 중 하나이다. 기존의 기계독해는 대부분 문서에 존재하는 짧고 간결한 답변 추출 문제를 풀고자 했으며 최근엔 불연속적인 범위를 추출하는 등의 확장된 문제를 다루는 데이터가 공개되었다. 불연속적인 답변 추출은 실제 애플리케이션에서 사용자에게 정보를 유연하게 제공해줄 수 있다. 따라서 본 논문에서는 기존의 간결한 단일 범위 추출에서 확장된 다중 범위 추출 시스템을 제안하고자 한다. 제안 모델은 문서를 구성하는 모든 토큰의 조합으로 구성된 Span Matrix를 통하여 다중 범위 추출 문제를 해결하고자 하며 실험을 통해 기존 연구들과 비교하여 가장 높은 86.8%의 성능을 보였다.

  • PDF

더 좋은 인코더 표현을 위한 뇌 동기화 모방 이중 번역 (Dual Translation Imitating Brain-To-Brain Coupling for Better Encoder Representations)

  • 최규현;김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-338
    • /
    • 2019
  • 인코더-디코더(Encoder-decoder)는 현대 기계 번역(Machine translation)의 가장 기본이 되는 모델이다. 인코딩은 마치 인간의 뇌가 출발어(Source language) 문장을 읽고 이해를 하는 과정과 유사하고, 디코딩은 뇌가 이해한 의미를 상응하는 도착어(Target language) 문장으로 재구성하는 행위와 비슷하다. 그렇다면 벡터로 된 인코더 표현은 문장을 읽고 이해함으로써 변화된 뇌의 상태에 해당한다고 볼 수 있다. 사람이 어떤 문장을 잘 번역하기 위해서는 그 문장에 대한 이해가 뒷받침되어야 하는 것처럼, 기계 역시 원 문장이 가진 의미를 제대로 인코딩해야 향상된 성능의 번역이 가능할 것이다. 본 논문에서는 뇌과학에서 뇌 동기화(Brain-to-brain coupling)라 일컫는 현상을 모방해, 출발어와 도착어의 공통된 의미를 인코딩하여 기계 번역 성능 향상에 도움을 줄 수 있는 이중 번역 기법을 소개한다.

  • PDF

문장 표현 단위를 활용한 기계독해 시스템 (Machine Reading Comprehension System using Sentence units Representation)

  • 장영진;이현구;신동욱;박찬훈;강인호;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.568-570
    • /
    • 2021
  • 기계독해 시스템은 주어진 질문에 대한 답변을 문서에서 찾아 사용자에게 제공해주는 질의응답 작업 중 하나이다. 하지만 대부분의 기계독해 데이터는 간결한 답변 추출을 다루며, 이는 실제 애플리케이션에서 유용하지 않을 수 있다. 실제 적용 단계에서는 짧고 간결한 답변 뿐 아니라 사용자에게 자세한 정보를 제공해줄 수 있는 긴 길이의 답변 제공도 필요하다. 따라서 본 논문에서는 짧은 답변과 긴 답변 모두 추출할 수 있는 모델을 제안한다. 실험을 통해 Baseline과 비교하여 짧은 답변 추출에서는 F1 score 기준 0.7%, 긴 답변 추출에는 1.4%p의 성능 향상을 보이는 결과를 얻었다.

  • PDF

자연어 이해 모델의 성능 향상을 위한 교차 게이트 메커니즘 방법 (Cross Gated Mechanism to Improve Natural Language Understanding)

  • 김성주;김원우;설용수;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-169
    • /
    • 2019
  • 자연어 이해 모델은 대화 시스템의 핵심적인 구성 요소로서 자연어 문장에 대해 그 의도와 정보를 파악하여 의도(intent)와 슬롯(slot)의 형태로 분석하는 모델이다. 최근 연구에서 의도와 슬롯의 추정을 단일 합동 모델(joint model)을 이용하여 합동 학습(joint training)을 하는 연구들이 진행되고 있다. 합동 모델을 이용한 합동 학습은 의도와 슬롯의 추정 정보가 모델 내에서 암시적으로 교류 되도록 하여 의도와 슬롯 추정 성능이 향상된다. 본 논문에서는 기존 합동 모델이 암시적으로 추정 정보를 교류하는 데서 더 나아가 모델 내의 의도와 슬롯 추정 정보를 명시적으로 교류하도록 모델링하여 의도와 슬롯 추정 성능을 높일 수 있는 교차 게이트 메커니즘(Cross Gated Mechanism)을 제안한다.

  • PDF

주요 포털사이트의 응답패킷분포에 관한 연구 (A study on distribution comparison of response packets for major portal sites)

  • 류귀열
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.437-444
    • /
    • 2013
  • 연구의 목적은 대한민국 주요 3개 포털사이트의 응답패킷 분포를 연구하는 것이다. 대상은 Naver, Daum, Nate 등 포털사이트의 대표페이지이며, 실험기간은 2010년 5월 19일에서 2012년 11월 7일까지이며, 실험횟수는 4,642회 실시하였다. 분포 형태는 응답패킷의 양이 많은 Naver, Nate는 양봉분포를 이루고 있으며, Daum은 오른쪽 꼬리가 긴 분포를 이루고 있다. 분포가 동일한가에 대한 검정은 카이제곱 검정, 이표본 콜모고로프-스미르노프 검정을 통하여 3개 포털의 분포가 유의수준 1%하에서 다르다는 사실을 밝혔다. 상대도수와 백분위 수의 비교를 통해 응답패킷의 분포를 비교하였다. 그 결과 응답패킷의 분포가 Naver가 가장 큰 값을 가졌으며, 다음은 Nate이었으며, Daum은 가장 작은 값을 가졌다. 응답속도를 높이기 위해서는 네트워크 속도를 높이는 것과 병행하여 페이지를 가볍게 만들어야 한다. 본 논문은 포털들이 페이지를 가볍게 만들게 하는 경쟁을 활성화하는데 기여하기를 기대한다.

학술정보포털에 대한 이용자만족 관련 인식에 관한 연구 - NAVER 전문정보의 학술자료 검색 기능을 중심으로 - (User Satisfaction related Perception of the Web Portal for Scholarly Information: Focused on the Academic Version of NAVER Search Engine)

  • 김양우
    • 한국문헌정보학회지
    • /
    • 제51권2호
    • /
    • pp.255-279
    • /
    • 2017
  • 본 연구는 NAVER 전문정보의 학술자료 검색 기능에 대한 이용자 만족과 관련된 인식을 조사한 질적 연구이다. 다양한 전공영역의 학부 학생들이 자신의 전공영역과 관련된 학술목적의 정보요구를 기반으로 스스로 선정한 탐색주제를 가지고 검색을 수행하는 과정에서 학술정보 전문포털에 대한 만족이나 불만족 등의 인식과 그 이유에 대한 조사가 이루어졌다. 수집된 데이터를 기반으로 한 연구결과는 인터페이스, 검색메커니즘 및 검색결과 등 세 가지 범주에 속하는 다양한 평가 항목 별로 제시되었다. 본 연구의 제언점은 1) 이용자들의 기본적인 관련 용어에 대한 제한한 지식 등을 토대로 한 시스템 인터페이스 개선 및 도움말 기능의 확대, 2) 상이한 맥락에서 사용된 검색어를 토대로 한 검색결과가 이용자 불만족으로 연결됨에 따른 검색 메커니즘의 개선 필요성, 그리고 3) 이용자들의 기본 용어 이해 부족과 더불어 검색 메커니즘 및 탐색기능에 대한 미흡한 식견을 기반으로 한 이용자교육의 제공 필요성으로 요약된다.

FubaoLM : 연쇄적 사고 증류와 앙상블 학습에 의한 대규모 언어 모델 자동 평가 (FubaoLM : Automatic Evaluation based on Chain-of-Thought Distillation with Ensemble Learning)

  • 김희주;전동현;권오준;권순환;김한수;이인권;김도현;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.448-453
    • /
    • 2023
  • 대규모 언어 모델 (Large Language Model, LLM)을 인간의 선호도 관점에서 평가하는 것은 기존의 벤치마크 평가와는 다른 도전적인 과제이다. 이를 위해, 기존 연구들은 강력한 LLM을 평가자로 사용하여 접근하였지만, 높은 비용 문제가 부각되었다. 또한, 평가자로서 LLM이 사용하는 주관적인 점수 기준은 모호하여 평가 결과의 신뢰성을 저해하며, 단일 모델에 의한 평가 결과는 편향될 가능성이 있다. 본 논문에서는 엄격한 기준을 활용하여 편향되지 않은 평가를 수행할 수 있는 평가 프레임워크 및 평가자 모델 'FubaoLM'을 제안한다. 우리의 평가 프레임워크는 심층적인 평가 기준을 통해 다수의 강력한 한국어 LLM을 활용하여 연쇄적 사고(Chain-of-Thought) 기반 평가를 수행한다. 이러한 평가 결과를 다수결로 통합하여 편향되지 않은 평가 결과를 도출하며, 지시 조정 (instruction tuning)을 통해 FubaoLM은 다수의 LLM으로 부터 평가 지식을 증류받는다. 더 나아가 본 논문에서는 전문가 기반 평가 데이터셋을 구축하여 FubaoLM 효과성을 입증한다. 우리의 실험에서 앙상블된 FubaoLM은 GPT-3.5 대비 16% 에서 23% 향상된 절대 평가 성능을 가지며, 이항 평가에서 인간과 유사한 선호도 평가 결과를 도출한다. 이를 통해 FubaoLM은 비교적 적은 비용으로도 높은 신뢰성을 유지하며, 편향되지 않은 평가를 수행할 수 있음을 보인다.

  • PDF

모바일 포털들의 응답시간 비교 및 분류에 관한 연구 (A Study on Comparison and Classification of Response Time of Mobile Portals)

  • 류귀열
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.1-7
    • /
    • 2018
  • 연구의 목적은 3개 모바일 포털사이트의 응답시간을 분포를 이용하여 비교하고 분류하는 것이다. 연구대상은 Naver, Daum, Nate의 모바일 포털 사이트 접속페이지이며, 실험기간은 모바일 포털들이 활성화되기 시작되던 즈음인 2012년 4월 18일에서 2018년 4월 17일까지 6년간이다. 그리고 실험횟수는 4,060회이다. 분포비교를 위해 히스토그램과 백분율을 이용하였으며 이론적인 비교를 위해 모수적 방법인 카이스케어 검정과 비모수적 방법인 콜모고로프-스미르노프 검정을 실시하였다. 네가지 방법 모두 Naver가 가장 빨랐고, 다음이 Nate, Daum이 가장 느렸다. 평균 응답시간 면에서도 같은 결과를 낳았다. 이러한 결과는 유선 포털의 결과와 정반대로서, Naver는 매체 특성에 맞게 유선에서는 많은 콘텐츠를 무선에서는 응답시간을 높이는 전략이고, Daum은 무선에서 응답시간을 희생하면서 콘텐츠를 중시하는 전략을 구사하고 있음을 알 수 있다. 분류에서는 응답시간에 따라 "Comfortable"과 "Tolerable", "Feedback", "Leave"로 나누었으며, 이용자들이 떠날 수 있다는 7초 이상인 "Leave"의 비율이 Naver는 1.18%, Daum이 11.70%, Nate가 1.5%로 Daum이 압도적으로 높아서 Daum의 응답시간은 개선이 매우 절실한 수준임을 알 수 있다. 또한 분류 결과에 의하면 3개 모바일 포털들이 응답시간을 줄이는 것이 필요하다는 것을 밝혔다. 본 논문의 결과가 모바일 포털들의 응답시간을 줄이는 기술경쟁을 촉진할 수 있기를 기대한다.

이커머스 후불결제(BNPL) 수용에 영향을 미치는 요인: 네이버쇼핑과 쿠팡 간 다중집단 비교 (Factors Affecting Consumers' Acceptance of e-Commerce Consumer Credit Service: Multiple Group Path Analysis by Naver Shopping and Coupang)

  • 김수진;모정훈
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.105-135
    • /
    • 2022
  • 코로나19로 인한 이커머스 거래의 급증으로 해외에서는 Buy Now Pay Later(선구매 후결제, 이하 BNPL)가 밀레니얼 세대 사이에서 차세대 결제 수단으로 부상했다. 국내에서는 네이버 쇼핑과 쿠팡이 후불결제를 제공해 고객 락인(lock-in) 효과, 카드사 수수료 절감, 소매금융사업 진출 등을 도모한다. 그러나 소비자 관점에서 후불결제의 수용에 영향을 미치는 요인에 관한 국내 연구는 부족하다. 이에 20~30대 대상으로 실증연구를 진행한 결과, 후불결제 수용에 영향을 미치는 요인은 네이버쇼핑은 호환성>혁신저항>충동구매 성향, 쿠팡은 호환성> 상대적 이점>혁신저항>추가가치 순으로 나타났다. 한편 네이버쇼핑은 충동구매 성향이 수용의도에 정(+)의 영향을 미치므로 연체율 관리가 관건이며, 쿠팡은 충동구매 성향이 지각된 위험에 정(+)의 영향을 미치므로 연체료, 신용등급 하락 등 위험 요소를 충분히 전달하고 후불결제로 유도한다는 느낌을 소비자가 받지 않도록 해야 한다. 후불결제 수용을 높이려면 타깃 고객을 세분화하고 버티컬 커머스와 제휴하는 방안을 추천한다.