• 제목/요약/키워드: word context

검색결과 353건 처리시간 0.027초

SG-Drop: Faster Skip-Gram by Dropping Context Words

  • Kim, DongJae;Synn, DoangJoo;Kim, Jong-Kook
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1014-1017
    • /
    • 2020
  • Many natural language processing (NLP) models utilize pre-trained word embeddings to leverage latent information. One of the most successful word embedding model is the Skip-gram (SG). In this paper, we propose a Skipgram drop (SG-Drop) model, which is a variation of the SG model. The SG-Drop model is designed to reduce training time efficiently. Furthermore, the SG-Drop allows controlling training time with its hyperparameter. It could train word embedding faster than reducing training epochs while better preserving the quality.

학습 장면에서 감정 개입을 촉진하기 위한 기능성 게임의 활용 - 단어 시각화 기반의 영어 학습용 기능성 게임 '워드 콜렉트리안' 제작 사례를 바탕으로 (A Study on Enhancing Emotional Engagement in Learning Situation - Based on Development Case of English Learning Serious Game 'Word Collectrian')

  • 이학수;도영임
    • 한국게임학회 논문지
    • /
    • 제12권6호
    • /
    • pp.95-106
    • /
    • 2012
  • 교육 현장에서 감정은 기억, 학습 성취, 동기부여에 있어 핵심적으로 중요한 요인으로 알려져 있다. 본 연구에서는 초등학교 아동들을 대상으로 감정적 개입(emotional engagement)을 촉진하기 위해 기능성 게임을 학습 현장에서 활용할 수 있는지를 확인해보고자 하였다. 이를 위해 영어 학습용 기능성 게임 '워드 콜렉트리안'을 이용하여 탐색 연구를 진행하였다. 워드 콜렉트리안은 인터액션을 통한 단어의 동적 시각화와 맥락 영상의 제시를 통한 상황 인지, 완성된 단어의 배치를 통한 단어에 대한 애착 고취 등을 활용하여 아동들이 감정적으로 영단어 학습에 효과적으로 개입할 수 있도록 설계하였다. 1차 프로토타입을 활용한 기초 실험 결과 워드 콜렉트리안이 학습 효과와 감정 개입의 효과를 모두 불러일으킬 수 있는 가능성이 있음을 확인할 수 있었다.

음성인식을 위한 의사(疑似) N-gram 언어모델에 관한 연구 (A Study on Pseudo N-gram Language Models for Speech Recognition)

  • 오세진;황철준;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.16-23
    • /
    • 2001
  • 본 논문에서는 대어휘 음성인식에서 널리 사용되고 있는 N-gram 언어모델을 중규모 어휘의 음성인식에서도 사용할 수 있는 의사(疑似) N-gram 언어모델을 제안한다. 제안방법은 ARPA 표준형식 N-gram 언어모델의 구조를 가지면서 각 단어의 확률을 임의로 부여하는 비교적 간단한 방법으로 1-gram은 모든 단어의 출현확률을 1로 설정하고, 2-gram은 허용할 수 있는 단어시작기호 와 WORD 및 WORD와 단어종료기호 의 접속확률만을 1로 설정하며, 3-gram은 단어 시작기호 와 WORD, 단어종료기호 만의 접속을 허용하며 접속확률을 1로 설정한다. 제안방법의 유효성을 확인하기 위해 사전실험으로서 국어공학센터(KLE) 단어음성에 대해 오프라인으로 평가한 견과, 남성 3인의 452 단어에 대해 평균 97.7%의 단어인식률을 구하였다. 또한 사전실험결과를 바탕으로 1,500단어의 중규모 어휘의 증권명을 대상으로 온라인 인식실험을 수행한 결과, 남성 20명이 발성한 20단어에 대해 평균 92.5%의 단어인식률을 얻어 제안방법의 유효성을 확인하였다.

  • PDF

OTT 서비스 이용자의 구전의도에 영향을 미치는 요인에 관한 연구: 감정요인을 중심으로 (A Study on the Precedent Factors of WOM Intention in the Context of OTT Service: Focusing on Emotional Factors)

  • 김유정
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.63-85
    • /
    • 2023
  • Purpose According to a recent survey, more than 90% of customers make purchase or use decisions for their products and services, primarily based on word-of-mouth(WOM) information (reviews, recommendations, ratings, etc.). However, few studies have explored what factors influence user's WOM intention in the context of OTT service. To address this gap, this study investigates the antecedent factors of WOM intention by adopting stimulus-organism-response (SOR) theory and pleasure arousal dominance (PAD) theory as a theoretical basis. Design/methodology/approach The research model consists of stimulus factors (diversity of original content, aesthetics, interactivity, personalization quality), emotional factors (pleasure, excitement, dominance), and behavioral factor (WOM intention). The research hypothesis was tested using the survey data collected from OTT service users of 305. Findings The result reveals that diversity of original content significantly affects on pleasure and arousal whereas it is not associated with dominance. Findings indicate that aesthetics positively influences pleasure, and interactivity is not associated with arousal. It is also proven that personalization quality has a positive effect on dominance. In addition, pleasure, arousal, and domination are proven to be positively and significantly related to WOM intention.

Association Modeling on Keyword and Abstract Data in Korean Port Research

  • Yoon, Hee-Young;Kwak, Il-Youp
    • Journal of Korea Trade
    • /
    • 제24권5호
    • /
    • pp.71-86
    • /
    • 2020
  • Purpose - This study investigates research trends by searching for English keywords and abstracts in 1,511 Korean journal articles in the Korea Citation Index from the 2002-2019 period using the term "Port." The study aims to lay the foundation for a more balanced development of port research. Design/methodology - Using abstract and keyword data, we perform frequency analysis and word embedding (Word2vec). A t-SNE plot shows the main keywords extracted using the TextRank algorithm. To analyze which words were used in what context in our two nine-year subperiods (2002-2010 and 2010-2019), we use Scattertext and scaled F-scores. Findings - First, during the 18-year study period, port research has developed through the convergence of diverse academic fields, covering 102 subject areas and 219 journals. Second, our frequency analysis of 4,431 keywords in 1,511 papers shows that the words "Port" (60 times), "Port Competitiveness" (33 times), and "Port Authority" (29 times), among others, are attractive to most researchers. Third, a word embedding analysis identifies the words highly correlated with the top eight keywords and visually shows four different subject clusters in a t-SNE plot. Fourth, we use Scattertext to compare words used in the two research sub-periods. Originality/value - This study is the first to apply abstract and keyword analysis and various text mining techniques to Korean journal articles in port research and thus has important implications. Further in-depth studies should collect a greater variety of textual data and analyze and compare port studies from different countries.

Aspect-Based Sentiment Analysis with Position Embedding Interactive Attention Network

  • Xiang, Yan;Zhang, Jiqun;Zhang, Zhoubin;Yu, Zhengtao;Xian, Yantuan
    • Journal of Information Processing Systems
    • /
    • 제18권5호
    • /
    • pp.614-627
    • /
    • 2022
  • Aspect-based sentiment analysis is to discover the sentiment polarity towards an aspect from user-generated natural language. So far, most of the methods only use the implicit position information of the aspect in the context, instead of directly utilizing the position relationship between the aspect and the sentiment terms. In fact, neighboring words of the aspect terms should be given more attention than other words in the context. This paper studies the influence of different position embedding methods on the sentimental polarities of given aspects, and proposes a position embedding interactive attention network based on a long short-term memory network. Firstly, it uses the position information of the context simultaneously in the input layer and the attention layer. Secondly, it mines the importance of different context words for the aspect with the interactive attention mechanism. Finally, it generates a valid representation of the aspect and the context for sentiment classification. The model which has been posed was evaluated on the datasets of the Semantic Evaluation 2014. Compared with other baseline models, the accuracy of our model increases by about 2% on the restaurant dataset and 1% on the laptop dataset.

의미적 맥락에 대한 처리가 암묵기억에 미치는 영향 (Effects of Conceptual Context on Implicit Memory)

  • 연은경;김민식
    • 인지과학
    • /
    • 제13권4호
    • /
    • pp.9-21
    • /
    • 2002
  • 맥락에 대한 의미적인 처리가 암묵기억의 수행에 어떠한 영향을 주는지에 관해서는 상반된 의견이 존재한다. 전이적합성처리 이론에 의하면 암묵기억은 지각적 처리에 주로 의존하기 때문에 맥락에 대한 의미처리가 기억수행에 영향을 미치지 않아야 한다(예, Blaxton, 1989). 반면 의미-특정적 이론에 의하면 암묵기억에서도 부호화 시 제시된 의미적 맥락에 대한 처리가 이루어지기 때문에 맥락에 대한 지각적 처리와 의미적 처리 모두 암묵기억 과제의 수행에 영향을 줄 것으로 예상한다(Lewandowsky 등, 1989). 본 연구는 부호화 시 혹은 부호화 시와 인출 시 제시되었던 맥락에 대한 의미적인 처리가 암묵기억의 과제 수행에 어떠한 영향을 미치는지 알아보기 위하여 실시되었다. 실험 1과 2에서는 우세 혹은 비우세 의미맥락을 지닌 동음이의어를 이용하여 학습 시와 검사 시의 맥락의 의미적 처리가 암묵기억 및 외현기억에 미치는 효과를 알아보았다. 그 결과 학습과 검사 시의 의미맥락의 변화는 외현기억의 수행에 영향을 주는 것으로 나타났으나 암묵기억 검사에서는 수행상의 차이를 보이지 않았다. 실험 3과 4에서는 Jacoby(1991)의. 처리-해리 절차를 사용하여 실험 1과 2 각각의 과제에서 통제처리와 자동처리의 효과를 분리하여 측정하였다. 그 결과, 암묵기억 검사 시 맥락 단서로 문장이 사용되면 통제처리의 영향이 증가됨을 보였으며, 이는 암묵기억의 요소 중에 의식적으로 통제되어 처리되는 부분은 의미적 맥락에 민감하게 영향을 받고 있음을 의미한다.

  • PDF

한글 워드임베딩과 아프리오리를 이용한 검색 시스템의 질의어 확장 (Query Extension of Retrieve System Using Hangul Word Embedding and Apriori)

  • 신동하;김창복
    • 한국항행학회논문지
    • /
    • 제20권6호
    • /
    • pp.617-624
    • /
    • 2016
  • 한글 워드임베딩은 명사 추출과정을 거치지 않으면, 학습에 필요하지 않은 단어까지 학습하게 되어 효율적인 임베딩 결과를 도출할 수 없다. 본 연구는 한글 워드임베딩, 아프리오리, 텍스트 마이닝을 이용하여, 특정 도메인에서 질의어 확장에 의해 보다 효율적으로 답변을 검색할 수 있는 모델을 제안하였다. 워드임베딩과 아프리오리는 질의어에 대해서 의미와 맥락에 따라 연관 단어를 추출하여, 질의어를 확장하는 단계이다. 한글 텍스트 마이닝은 명사 추출, TF-IDF, 코사인 유사도를 이용하여, 유사답변 추출과 사용자에게 답변하는 단계이다. 제안모델은 특정 도메인의 답변을 학습하고, 연관성 높은 질의어를 확장함으로서 답변의 정확성을 높일 수 있다. 향후 연구과제로서, 데이터베이스에 저장된 사용자 질의를 분석하고, 보다 연관성 높은 질의어를 추출하는 연구가 필요하다.

한글 문장의 자동 띄어쓰기를 위한 두 가지 통계적 모델 (Two Statistical Models for Automatic Word Spacing of Korean Sentences)

  • 이도길;이상주;임희석;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.358-371
    • /
    • 2003
  • 자동 띄어쓰기는 문장 내에서 잘못 띄어쓴 어절들을 올바르게 복원하는 과정으로서, 독자에게 글의 가독성을 높이고 문장의 뜻을 정확히 전달하기 위해 매우 중요하다. 기존의 통계 기반 자동 띄어쓰기 접근 방법들은 이전 띄어쓰기 상태를 고려하지 않기 때문에 잘못된 확률 정보에 의한 띄어쓰기를 할 수밖에 없었다. 본 논문에서는 기존의 통계 기반 접근 방법 의 문제점을 해결할 수 있는 두 가지 통계적 띄어쓰기 모델을 제안한다. 제안하는 모델은 자동 띄어쓰기를 품사 부착과 같은 분류 문제(classification problem)로 간주할 수 있다는 착안에 기반하며, 은닉 마르코프 모델을 일반화함으로써 확장된 문맥을 고려할 수 있고 보다 정확한 확률을 추정할 수 있도록 고안되었다. 제안하는 모델과 지금까지 가장 좋은 성능을 보이는 기존의 방법을 비교하기 위해 여러 가지 실험 조건에 따른 다양한 실험을 수행하였고, 오류에 대한 자세한 분석을 제시하고 있다 제안하는 모델을 복합 명사를 고려하는 평가 방식에 적응한 실험 결과, 98.33%의 음절 단위 정확도와 93.06%외 어절단위 정확률을 얻었다.

단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 (Document Classification using Recurrent Neural Network with Word Sense and Contexts)

  • 주종민;김남훈;양형정;박혁로
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권7호
    • /
    • pp.259-266
    • /
    • 2018
  • 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.