• 제목/요약/키워드: NLP

검색결과 351건 처리시간 0.02초

검색의도에 적합한 스니펫 추출 (Extract Snippets Suitable for Search Intent)

  • 이현구;양윤영;김은별;차우준;노윤영;김은영;최규현;신동욱;박찬훈;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.241-246
    • /
    • 2021
  • 스니펫 추출은 정보검색에서 주요한 문서 정보를 짧은 문단 형태로 보여주는 것으로 사용자가 검색결과를 좀 더 효율적으로 확인할 수 있게 도와준다. 그러나 기존 스니펫은 어휘가 일치하는 문장을 찾아 보여주기에 검색의도가 반영되기 어렵다. 또한 의미적 정답을 찾기 위해 질의응답 방법론이 응용되고 있지만 오픈 도메인 환경에서 품질이 낮은 문제가 있다. 본 논문은 이러한 문제를 해결하기 위해 스니펫 추출, 의도 부착, 검증 3단계로 스니펫을 추출하여 추출된 스니펫이 질의 의도에 적합하게 추출되도록 하는 방법을 제안한다. 실험 결과 전통적인 스니펫보다 만족도가 높은 것을 보였고, 스니펫 추출만 했을 때보다 의도 부착, 검증을 하였을 때 정확도가 0.3165만큼 향상되는 것을 보였다.

  • PDF

키워드 추출용 구묶음 데이터 구축 및 개선 방법 연구 (Study on Making Chunking Dataset for Keyword Extraction and its Improvement Methods)

  • 이민호;최맹식;김정아;이충희;김보희;오효정;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.512-517
    • /
    • 2020
  • 구묶음은 문장을 겹치지 않는 문장 구성 성분으로 나누는 과정으로, 구묶음 방법에 따라 구문분석, 관계 추출 등 다양한 하위 태스크에 사용할 수 있다. 본 논문에서는 문장의 키워드를 추출하기 위한 구묶음 방식을 제안하고, 키워드 단위 구묶음 데이터를 구축하기 위한 가이드라인을 제작하였다. 해당 가이드라인을 적용하여 구축한 데이터와 BERT 기반의 모델을 이용하여 학습 및 평가를 통해 구축된 데이터의 품질을 측정하여 78점의 F1점수를 얻었다. 이후 패턴 통일, 형태소 표시 여부 등 다양한 개선 방법의 적용 및 재실험을 통해 가이드라인의 개선 방향을 제시한다.

  • PDF

NLP 활용 사례 분석 및 도입에 관한 연구: 분석 프레임워크와 시사점 (A Study on Use Case Analysis and Adoption of NLP: Analysis Framework and Implications)

  • 박현정;임희석
    • 한국IT서비스학회지
    • /
    • 제21권2호
    • /
    • pp.61-84
    • /
    • 2022
  • With the recent application of deep learning to Natural Language Processing (NLP), the performance of NLP has improved significantly and NLP is emerging as a core competency of organizations. However, when encountering NLP use cases that are sporadically reported through various online and offline channels, it is often difficult to come up with a big picture of how to understand and interpret them or how to connect them to business. This study presents a framework for systematically analyzing NLP use cases, considering the characteristics of NLP techniques applicable to almost all industries and business functions, environmental changes in the era of the Fourth Industrial Revolution, and the effectiveness of adopting NLP reflecting all business functional areas. Through solving research questions based on the framework, the usefulness of it is validated. First, by accumulating NLP use cases and pivoting them around the business function dimension, we derive how NLP techniques are used in each business functional area. Next, by synthesizing related surveys and reports to the accumulated use cases, we draw implications for each business function and major NLP techniques. This work promotes the creation of innovative business scenarios and provides multilateral implications for the adoption of NLP by systematically viewing NLP techniques, industries, and business functional areas. The use case analysis framework proposed in this study presents a new perspective for research on new technology use cases. It also helps explore strategies that can dramatically improve organizational performance through a holistic approach that encompasses all business functional areas.

과학교육 분야 자연어 처리 기법의 연구동향 분석 (An Analysis of Trends in Natural Language Processing Research in the Field of Science Education)

  • 전철홍;유선아
    • 한국과학교육학회지
    • /
    • 제44권1호
    • /
    • pp.39-55
    • /
    • 2024
  • 본 연구는 2011년부터 2023년 9월까지 과학교육 분야에서 자연어 처리(NLP) 기법을 적용한 37건의 국내 및 해외 문헌을 분석하여 과학교육에서의 NLP 관련 연구 동향을 파악하고자 하였다. 특히 과학교육에서 NLP 기법의 주요 응용 분야, NLP 기법을 활용할 때 교사의 역할, 국내와 해외의 비교 측면에서 그 내용을 체계적으로 분석하였다. 분석 결과는 다음과 같다. 첫째, NLP 기법이 과학교육에서 형성평가, 자동 채점, 문헌 검토 및 분류, 패턴 추출에 중요하게 활용되고 있음을 확인하였다. 형성평가에서 NLP를 활용하면 학생들의 학습과정과 이해도를 실시간으로 분석할 수 있다. 이는 교사의 수업에 대한 부담을 줄이고, 학생들에게 정확하고 효과적인 피드백을 제공할 수 있다. 자동 채점에서는 학생들의 응답을 빠르고 정확하게 평가하는 데 기여한다. 문헌 검토 및 분류에서는 과학교육 관련 연구나 학생들의 보고서를 분석하여 주제와 트렌드를 효과적으로 분석하고, 미래 연구 방향을 설정하는 데 도움을 준다. NLP 기법을 패턴 추출에 활용하면 학생들의 생각과 반응에 나타난 공통점이나 패턴을 찾아 효과적으로 분석할 수 있다. 둘째, 과학교육에서 NLP 기법의 도입은 교사의 역할을 지식 전달자에서 학생들의 학습을 지원하고 촉진하는 지도자로 확장했고, 교사들에게 지속적인 전문성 개발을 요구한다. 셋째, 국내에서는 문헌 검토 및 분류에 집중되어 있어 국내 NLP 연구의 다양성을 위해 텍스트 데이터 수집이 용이한 환경 조성이 필요하다. 이러한 분석 결과를 바탕으로 과학교육에서 NLP 기법의 활용하는 방법에 대해 논의하였다.

대장균의 전사조절 유전자 nlp의 분자기구 해석 (Analysis of the Molecular Mechanism of nlp Gene Involved in Transcriptional Regulation in Escherichia coli)

  • 최용락;정수열;정정한;정영기
    • 한국미생물·생명공학회지
    • /
    • 제21권3호
    • /
    • pp.229-238
    • /
    • 1993
  • An nlp (Ner like protein) gene from E. coli was previously cloned and sequenced. Here we show that expression of the sugar metabolism related genes, lacZ, malQ and malP, increased 2.5-to 8.3-fold in the presence of a plasmid containing the nlp gene. This suggested that the nlp gene could induce maltose- and lactose-metabolism coordinately with crp*1 in the absence of cAMP. Using the nlp-lacZ fusion gene, it was possible to show the promoter of nlp was active in vivo.

  • PDF

더 좋은 인코더 표현을 위한 뇌 동기화 모방 이중 번역 (Dual Translation Imitating Brain-To-Brain Coupling for Better Encoder Representations)

  • 최규현;김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-338
    • /
    • 2019
  • 인코더-디코더(Encoder-decoder)는 현대 기계 번역(Machine translation)의 가장 기본이 되는 모델이다. 인코딩은 마치 인간의 뇌가 출발어(Source language) 문장을 읽고 이해를 하는 과정과 유사하고, 디코딩은 뇌가 이해한 의미를 상응하는 도착어(Target language) 문장으로 재구성하는 행위와 비슷하다. 그렇다면 벡터로 된 인코더 표현은 문장을 읽고 이해함으로써 변화된 뇌의 상태에 해당한다고 볼 수 있다. 사람이 어떤 문장을 잘 번역하기 위해서는 그 문장에 대한 이해가 뒷받침되어야 하는 것처럼, 기계 역시 원 문장이 가진 의미를 제대로 인코딩해야 향상된 성능의 번역이 가능할 것이다. 본 논문에서는 뇌과학에서 뇌 동기화(Brain-to-brain coupling)라 일컫는 현상을 모방해, 출발어와 도착어의 공통된 의미를 인코딩하여 기계 번역 성능 향상에 도움을 줄 수 있는 이중 번역 기법을 소개한다.

  • PDF

sent2dl : 기술논리 SROIQ 기반 기호적 문장 의미 표상에 분산 표상 더하기 (sent2dl : Augmenting Distributional Semantics to Symbolic Sentence Meaning Representation based on Description Logic SROIQ)

  • 신승우;오주민;노형종;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-204
    • /
    • 2020
  • 기존의 자연어 의미 표상 방법은 크게 나눠보았을 때 두 가지가 있다. 첫 번째로, 전통적인 기호 기반 의미 표상 방법론이다. 이 방법론들은 논리적이고 해석가능하다는 장점이 있으나, 구축에 시간이 많이 들고 정작 기호 자체의 의미를 더욱 미시적으로 파악하기 어렵다는 단점이 있었다. 반면, 최근 대두된 분산 표상의 경우 단어 하나하나의 의미는 상대적으로 잘 파악하는 반면, 문장 등의 복잡한 구조의 의미를 나타내는 데 있어 상대적으로 약한 측면을 보이며 해석가능하지 않다는 단점이 있다. 본 논문에서는 이 둘의 장점을 섞어서 서로의 단점을 보완하는 새로운 의미 표상을 제안하였으며, 이 표상이 유의미하게 문장의 의미를 담고 있음을 비지도 문장 군집화 문제를 통해 간접적으로 보였다.

  • PDF

한국어 NLP2RDF 프레임워크 (Korean NLP2RDF Framework)

  • 원유성;서지우;김정욱;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-220
    • /
    • 2014
  • 본 논문은 LOD2 커뮤니티 과제 중 하나인 NLP2RDF를 한국어에 적용하면서 고안한 프레임워크에 대해 제시하고 있다. 이 프레임워크를 통해, 한국어 NLP2RDF는 다양한 한국어 자연언어처리 도구들로 부터의 결과물 및 다양한 한국어 언어 자원에 대한 활용도 높은 이용 방법에 대한 제시 및 국제적 상호 운용성을 위해 NIF(NLP Interchange Format)[1] 규격을 준수한 RDF(Resource Description Framework)를 생성하기 위한 방법론을 소개한다. 또한 NIF(NLP Interchange Format)를 통한 포맷 통일화 과정에서 발생하는 NIF 온톨로지의 불완전성에 대한 개선 방향에 대해서도 갼략하게 제시한다.

  • PDF

치과 공포증환자의 불안 경감을 위한 NLP기법에 대한 고찰 (A review on the NLP techniques for reducing anxiety in dental phobic patients)

  • 권원달;설기문
    • 대한치과의사협회지
    • /
    • 제48권11호
    • /
    • pp.829-840
    • /
    • 2010
  • In recent years, medical techniques have provided patients with various measures to improve their quality of life. For dental treatment, drug-mediated sedation techniques for relieving dental anxiety have been developed, but behavior control through drugmediation may be limited because of possible side effects, contraindications, and the additional expense to the patient. Many patients tend to avoid the treatment or are unwilling to accept it and this makes both patients and dentists feel pressured. The field of NLP application might alleviate this uncomfortableness. Recently, NLP has spread to the dental and medical field rapidly and has been used in surgical treatments as well as in direct psychotherapy. NLP techniques which could be applied to dental phobic patients are as follows. 1) anchoring, 2) dissociation, 3) submodality change, 4) time line threapy, 5) swish pattern, 6) six step reframing, 7) parts integration, 8) modeling and imagination and so on. The aim of this study is to examine the strategy of NLP psychology so that dental phobic patients can be treated efficiently and effectively by the application of behavior management. Through NLP, patients can be induced to have more positive attitudes and experiences in future dental treatment.

Multiple-loading condition을 고려한 구조체의 위상학적 최적화 (Topological Structural Optimization under Multiple-Loading Conditions)

  • 박재형;홍순조;이리형
    • 전산구조공학
    • /
    • 제9권3호
    • /
    • pp.179-186
    • /
    • 1996
  • 본 연구에서는 구조체의 위상학적 최적화를 위한 비선형 formulation(NLP)가 개발, 검토되었다. 이 NLP는 multiple-loading하에서 임의의 오브젝티브 함수, 응력, 변위 제약조건들을 쉽게 다룰 수가 있다. 또한 이 NLP는 해석과 최적화 디자인을 동시에 실시함으로써 요소 사이즈가 영으로 접근함에 따른 강성 매트릭스의 singularity를 피할 수 있다. 즉, 평형 방정식을 등제약조건으로 치환함으로써 강성 매트릭스 그 자체나 그의 역매트릭스를 구할 필요도 없어진다. 이 NLP는 multiple-loading conditon하에서 테스트되었으며, 이를 통해 이 NLP가 다양한 제약조건하에서 강력하게 작용함이 입증되었다.

  • PDF