• 제목/요약/키워드: Word Tree

검색결과 95건 처리시간 0.025초

방향 비순환 그래프의 중심성을 이용한 위키데이터 기반 분류체계 구축 (Taxonomy Induction from Wikidata using Directed Acyclic Graph's Centrality)

  • 전희선;김현호;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.582-587
    • /
    • 2021
  • 한국어 통합 지식베이스를 생성하기 위해 필수적인 분류체계(taxonomy)를 구축하는 방식을 제안한다. 위키데이터를 기반으로 분류 후보군을 추출하고, 상하위 관계를 통해 방향 비순환 그래프(Directed Acyclic Graph)를 구성한 뒤, 국부적 도달 중심성(local reaching centrality) 등의 정보를 활용하여 정제함으로써 246 개의 분류와 314 개의 상하위 관계를 갖는 분류체계를 생성한다. 워드넷(WordNet), 디비피디아(DBpedia) 등 기존 링크드 오픈 데이터의 분류체계 대비 깊이 있는 계층 구조를 나타내며, 다중 상위 분류를 지닐 수 있는 비트리(non-tree) 구조를 지닌다. 또한, 위키데이터 속성에 기반하여 위키데이터 정보가 있는 인스턴스(instance)에 자동으로 분류를 부여할 수 있으며, 해당 방식으로 실험한 결과 99.83%의 분류 할당 커버리지(coverage) 및 99.81%의 분류 예측 정확도(accuracy)를 나타냈다.

  • PDF

통화정책 결정문에 나타난 한미 통화정책 동조화 현상 분석 (Monetary policy synchronization of Korea and United States reflected in the statements)

  • 장영재
    • 응용통계연구
    • /
    • 제34권1호
    • /
    • pp.115-126
    • /
    • 2021
  • 중앙은행은 통화정책을 운용하면서 통화정책 방향에 관한 보고서를 통해 시장과 소통하고 있다. 최근의 Covid-19 팬데믹은 세계적인 경제의 급격한 위축을 초래하였다. 2008년 글로벌 금융위기 시와 비교해 보더라도 불확실성이 적지 않은 상황이다. 그 파급효과가 전 세계적으로 확산되면서 경기침체의 장기화에 관한 우려도 증폭되고 있다. 본 논문에서는 미 연준과 한국은행의 통화정책을 담고 있는 통화정책방향 결정문과 의결문의 특징을 분석하고 세계적인 위기에 어떠한 영향을 받았는지 살펴보았다. 분석을 위해 1999년 10월부터 2020년 9월까지 공표된 양 국가의 통화정책방향 보고서 텍스트 자료를 수집하였으며 워드 클라우드 및 워드 임베딩 등을 이용하여 의미상 특징을 살펴보았다. 조각별 회귀나무 모형을 통해 양국 문서의 비유사성 추이도 분석해 보았다. 분석 결과 한국은행과 미 연준 모두 시장과의 투명하고 효과적인 소통을 위해 명확한 의미를 지닌 단어로 정제된 문서 자료를 작성하고 있는 것으로 나타났다. 또한, 급격한 글로벌 경제환경의 변화가 통화정책에 영향을 미치면서 문서 간 의미상 동조화가 이루진 것으로 나타났다.

Efficient Keyword Extraction from Social Big Data Based on Cohesion Scoring

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.87-94
    • /
    • 2020
  • 블로그나 SNS 피드 등의 소셜 리뷰는 고객 관점의 의견이나 불만 사항을 반영한 키워드를 추출하기 위한 목적으로 광범위하게 활용되고 있으며, 최근 트렌드를 반영한 신조어나 고유명사를 포함하는 경우가 많다. 이들 단어는 사전에 포함되어 있지 않아 기존 형태소 분석기가 잘 인지하지 못하는 경우가 많으며, 동시에 상당한 처리 시간이 소요되어 키워드 분석 결과를 실시간으로 제공하는데 어려움이 있다. 본 논문에서는 응집도 점수 개념을 기반으로 소셜 리뷰로부터 키워드를 효율적으로 추출하기 위한 방법을 제안한다. 응집도 점수는 단어의 빈도수를 기반으로 계산되어 별도의 사전이 필요없다는 장점이 있으나, 띄어쓰기가 되지 않은 입력 데이터에 대해서는 정확도가 떨어질 수 있다. 이와 관련하여 본 논문에서는 단어 트리 구조를 이용하여 기존의 응집도 점수 계산 방법을 개선한 알고리즘을 제시한다. 또한 실험을 통해 제안하는 방법이 15.5%의 오류율을 보이는 동시에, 1,000개의 리뷰를 처리하는데 0.008초 정도 소요됨을 확인하였다.

문헌을 통해 본 녹나무[장(樟)]의 오류 고찰 (The review of Cinnamomum camphora SIEB.'s mistake in historical documents)

  • 김규섭;이창훈;김세호
    • 한국전통조경학회지
    • /
    • 제33권2호
    • /
    • pp.58-66
    • /
    • 2015
  • 본 연구는 고려시대 및 조선시대 고문헌에 출현한 녹나무의 기록을 고찰한 논문이다. 녹나무의 한자 표기인 '장(樟)' 자를 바탕으로 녹나무의 정의와 용도를 살펴보았고, 현대적 개념과의 오류 사례를 분석하여 다음과 같은 가능성을 제시하고자하였다. 첫째, 녹나무에 대한 정의와 사례를 분석한 결과, 현재 녹나무로 해석되는 남(枏) 남(楠) 예(豫) 장(樟) 가운데, '장(樟)'이 현대적인 개념의 녹나무에 가장 부합한 것으로 나타났다. 둘째, 과거의 기록에서 녹나무가 생육 불가능한 지역에 출현하는 모습을 확인하였는데, 녹나무는 대표적인 남부수종이니 녹나무가 아닌 다른 나무를 녹나무라 지칭한 오류로 사료된다. 셋째, 다른 수종과 오인한 사례들을 추적하여 기록을 고찰한 결과, 이규경의 "오주연문장전산고" 중 "침뇌변증설"에서 모감주나무와 혼동했을 가능성이 확인되었다. 이상 본 연구에서 살펴본 녹나무의 경우 외에도 여타 문헌에 나타난 오류 사례의 검증이 요구된다. 또한 현대의 성상별 기준과 문헌의 대조를 통해 선별하는 과정을 병행하여, 녹나무에 대한 새로운 가능성을 도출할 후속연구를 기대하는 바이다.

트리 구조를 이용한 수식 인식 연구 (A Study on Equation Recognition Using Tree Structure)

  • 박병준;김현식;김완태
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.340-345
    • /
    • 2018
  • 수식은 일반 문장에 비해 복잡한 구조와 다양한 문자와 기호가 사용되어 단순한 키보드 입력만으로는 모든 문자 집합을 입력할 수 없어 한글이나 워드 같은 문서편집기 내에서도 자체적으로 구현된 수식 편집기를 사용하고 있다. 수식을 올바르게 표현하기 위해 구문을 해석할 수 있는 의미가 될 수 있는 사전 학습 정보가 필요하다. 문자가 입력되더라도 크기와 위치 서로간의 관계에 따라 다른 수식으로 표현될 수 있기 때문이다. 즉 표현될 위치와 크기 등 문자와 기호들 간의 상호관계를 고려하여 수식의 형태를 트리 모델로 표현한다. 문자인식 응용의 한 분야로 문자나 기호(부호)를 인식하는 기술을 이미 널리 알려졌지만, 수식을 입력과 해석하는 방법은 일반적인 텍스트에 비해 복잡한 분석 과정이 필요하다. 본 논문에서는 수식의 문자를 인식하고 표현되는 위치와 크기의 결정을 빠르게 해석하는 수식 인식기를 구현하였다.

개인의 감성 분석 기반 향 추천 미러 설계 (Design of a Mirror for Fragrance Recommendation based on Personal Emotion Analysis)

  • 김현지;오유수
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문에서는 사용자의 감정 분석에 따른 향을 추천하는 스마트 미러 시스템을 제안한다. 본 논문은 자연어 처리 중 임베딩 기법(CounterVectorizer와 TF-IDF 기법), 머신러닝 분류 기법 중 최적의 모델(DecisionTree, SVM, RandomForest, SGD Classifier)을 융합하여 시스템을 구축하고 그 결과를 비교한다. 실험 결과, 가장 높은 성능을 보이는 SVM과 워드 임베딩을 파이프라인 기법으로 감정 분류기 모델에 적용한다. 제안된 시스템은 Flask 웹 프레임워크를 이용하여 웹 서비스를 제공하는 개인감정 분석 기반 향 추천 미러를 구현한다. 본 논문은 Google Speech Cloud API를 이용하여 사용자의 음성을 인식하고 STT(Speech To Text)로 음성 변환된 텍스트 데이터를 사용한다. 제안된 시스템은 날씨, 습도, 위치, 명언, 시간, 일정 관리에 대한 정보를 사용자에게 제공한다.

잘못 형성된 입력문장에 대한 CHART PARSER (CHART PARSER FOR ILL-FORMED INPUT SENTENCES)

  • 민경호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.177-212
    • /
    • 1993
  • 본 연구는 잘못 형성된 입력에 대한 멜리쉬의 연구(1989)에 기반하고 있다. 이 글은 chart-based parser를 이용하여 구문론적 차원에서 잘못 형성된 입력 문자의 복구에 촛점을 둔다. 멜리쉬의 체계는 두가지 분석기, 즉 잘형성된 입력 분석기와 잘못 형성된 입력 분석기로 구성되는데, 필자의 연구는 그에 생각을 따르고 있다. 이글에서는 주로 chartparsing의 개념, 잘못형성된 입력에 대한 분석전략이 논의된다. 또한 필자가 제시하는 체계의 디자인과 구현, 필자의 체계를 멜리쉬의 체계와의 비교와 같은 사항들이 다루어질 것이다.

선택 제약 명사의 의미 범주 정보를 이용한 용언의 문맥 의존 오류 검사 및 교정 (The Detection and Correction of Context Dependent Errors of The Predicate using Noun Classes of Selectional Restrictions)

  • 소길자;권혁철
    • 한국정보통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.25-31
    • /
    • 2014
  • 현재 실용화된 국내 문법 검사기는 경험적으로 구축된 오류 결정 규칙을 이용해 주위의 문맥을 보고 문법 오류를 판단하는 문맥 의존 오류를 처리하고 있다. 그러나 기존 문법 검사기의 오류 결정 규칙은 어휘 수준으로 구축되어 있어 검사기의 재현율이 낮다. 따라서 어휘대신 어휘 범주 정보를 사용하여 오류 결정 규칙을 일반화할 필요가 있다. 본 논문에서는 검사단어가 용언일 때 선택 제약 명사의 의미 범주를 국내에서 개발된 어휘의미망 KorLex에서 TCM과 MDL을 이용해 추출하고 추출된 의미 범주를 이용해 용언의 오류 결정 규칙을 일반화하는 방법을 제안한다.

음성신호의 실시간 피치변경에 관한 연구 (A Study on Real Time Pitch Alteration of Speech Signal)

  • 김종국;박형빈;배명진
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.82-89
    • /
    • 2004
  • 고음질 합성을 하면서도 다양한 음색을 갖도록 하기 위해서는 파형부호화를 이용한 합성법에 적용할 수 있는 피치 변경법이 필요하다. 따라서 본 논문에서는 스펙트럼 왜곡률을 최소화하는 영교차 단위의 시간축 조절에 의한 피치 변경법과 피치 동기분석이 용이하고 다른 영역으로의 변환과정이 불필요한 피치시점 검출법을 제안함으로써 고음질을 유지하면서 시간영역에서만 처리됨으로써 계산량을 줄이고 스펙트럼 왜곡률을 최소화하고 위상을 그대로 보존할 수 있는 시간영역에서의 피치 변경법을 제안하였다. 결과적으로 전체 피치 변경율에 대해서는 기존의 방법에 비해서 제안한 방법의 스펙트럼 왜곡률이 0.73%개선되었고 피치 압축시에는 제안한 방법의 스펙트럼 왜곡율이 2.18%개선되었다.

한국 한의학 문헌에 나타난 봉합수술에 관한 소고 (A Study about Suture Surgery written in Traditional Korean Medical Books)

  • 방성혜;차웅석;김남일
    • 한국의사학회지
    • /
    • 제23권2호
    • /
    • pp.47-56
    • /
    • 2010
  • The objective of this article is to investigate and analyze the way how the suture surgery was operated in case of external wound or incision in past Korea. The method to do this study was to search the books on the website, Knowledge of Oriental Medicine Web Service, databased and serviced by Korean Institute of Oriental Medicine. The searching key word was '縫'. The results was as follows. According to the website search, ten subjects of suture surgery could be classified: sword wound(金瘡), horse bite(馬咬), intestine incision(腸肚傷), knife or ax wound(刀斧傷), larynx incision(割喉), intestine protrusion by cow collision(牛觸腸出), self-stabbing of neck(自刎), falling from tree(童稚上木墮下), lip injury(趺損唇皮) and face wound(顔面의 外傷). Furthermore, the kinds of suturing fiber, the way how to stitch, the kinds of medical care before and after the suture surgery could also be found