• 제목/요약/키워드: Corpus-based

검색결과 568건 처리시간 0.029초

컴퓨터 문헌 분석 기반의 토끼전 '어족회의' 대목 내용 유사도에 따른 이본 계통 분류 연구 (A Study of Computational Literature Analysis based Classification for a Pairwise Comparison by Contents Similarity in a section of Tokkijeon, 'Fish Tribe Conference')

  • 김동건;정화영
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.15-25
    • /
    • 2022
  • 본 연구는 컴퓨터 문헌 분석 기법을 활용하여 <토끼전> '어족회의' 대목의 계열과 계통을 밝히는 데에 목적을 둔다. 우선 각 단락의 이본 유형을 인코딩하여 코퍼스를 구축하고, 이를 바탕으로 해밍 거리를 이용하여 각 이본 간의 거리 행렬을 산출하였다. 그다음 산출된 거리 행렬을 다차원 척도법, 계층적 군집 분석을 적용하여 이본의 군집 양상을 시각화하여, 기존에 토끼전 전체 단락을 대상으로 한 군집 분석 연구와 비교하여 '어족회의' 대목의 계열과 계통 특징을 살펴보았다. 그 결과 토끼전 전체 단락을 대상으로 한 군집 분석이 6개의 계열을 이루고 있는 것과는 달리, '어족회의' 대목은 5개의 계열을 이루고 있다는 점과 몇몇 이본의 계열 출입이 있다는 점을 확인할 수 있었다. 본 연구의 성과는 계산에 의한 객관적이고 실증적인 방법으로 이본 간의 상대적 거리 측정하고 계통 분류를 했다는 점과 토끼전 전체를 내용을 대상으로 한 계열 분석과 대비하여 어족회의 대목 계열의 특징을 밝혔다는 데에 있다.

의미간의 유사도 연구의 패러다임 변화의 필요성-인지 의미론적 관점에서의 고찰 (The Need for Paradigm Shift in Semantic Similarity and Semantic Relatedness : From Cognitive Semantics Perspective)

  • 최영석;박진수
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.111-123
    • /
    • 2013
  • 개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

전침자극(電針刺戟)에 의한 흰쥐 중추신경계(中樞神經系)내 대사활성(代謝活性) 변화(變化)의 영상화(映像化) 연구(硏究) (2-DG Autoradiographic Imaging of Brain Activity Patterns by Electroacupuncture Stimulation in Awake Rats)

  • 손영주;원란;정혁상;김용석;박영배;손낙원
    • Journal of Acupuncture Research
    • /
    • 제18권3호
    • /
    • pp.56-68
    • /
    • 2001
  • Objective : Functional brain mapping study on acupuncture stimulation using the [14C]2-deoxyglucose([14C]2-DG) autoradiography provides quantitative data and visualized pathway in central nervous system(CNS). We aimed to investigate the neural pathway and spatial distribution of metabolic activity elicited in CNS on electroacupuncture stimulation using [14C]2-DG autoradiography. Methods : The study were divided into three groups by stimulation times. 45-mins stimulation group according to Sokoloffs method, 5-mins stimulation group according to Duncun's method, and 15-mins stimulation group. ;A venous catheter was equipped into right jugular vein. The rats (Sprague-Dawley rats, 230-260g) were kept fastened loosely on a holding platform without anesthesia. Electroacupuncture stimulation (5 ms, 2 Hz, 1~3 mA) were applied on the left Zusanli (ST36) acupoint and [14C]2-DG ($25{\mu}Ci/rat$) injection was performed through the catheter. After sacrifice, the brain and the spinal cord were made to sections for film image. The film images were digitalized as the isotope concentration based upon comparison of optical densities with that of the standards and normalized by the optical density of corpus callosum. Results : 1. 15-mins stimulation group was most effective among 3 experiments. 2. On 15-mins stimulation group, medial geniculate nucleus, intetpeduncular nucleus intermedius, ventral periolivary nucleus, caudal periolivary nucleus, medial superior olive, lateral paragigantocellular nucleus, including hypothalamic arcuate nucleus were increased by more than 25% (at least, p<0.05) by electroacupuncture stimulation. 3. Especially, the metabolism in hypothalamic arcuate nucleus was increased by 90% (p<0.05). 4. The fact that arcuate nucleus of hypothalamus might play a role of interconnection area between ascending and descending pathway of acupuncture stimulation was demonstrated visually. Conclusions : Advanced study on electroacupuncture stimulation elicited significant increase of metabolic activity in various nuclei of hypothalamus will provide the important experimental basis in research of the relationship between electroacupuncture stimulation and internal visceral functions.

  • PDF

비핵심어 모델의 가중치 기반 핵심어 검출 성능 향상에 관한 연구 (A Study of Keyword Spotting System Based on the Weight of Non-Keyword Model)

  • 김학진;김순협
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.381-388
    • /
    • 2003
  • 본 논문에서는 핵심어 검출기의 성능 향상을 위해 가베지 클라스 클러스터링과 함께 필러 모델에 가중치론 부여하는 방안 및 태스크 도메인 이용자들의 발화 음성의 성향 분석을 통해 핵심어 천이 확률을 계산하여 핵심어 검출기반 대화 음성처리 시스템의 처리 시간 단축 방안을 제안한다. 제안한 방법은 음성학적으로 유사한 음소끼리 묶어서 사용함으로써 하나의 음소는 잘 표현하지 못하지만 비슷한 음소 그룹의 표현에는 유용한 방법으로 본 논문에서는 한국어 형태론과 태스크 도메인으로 선정한 증권거래 대화음성처리 시스템에서 활용되는 발화 문장을 분석하여 5 음소군을 제시한다. 또한 이들 음소군에 태스크 종속적인 필러 모델 가중치를 부여하며, 두 번째로는 시스템의 처리시간 단축을 위해 연속 발화 문장 속에 포함되어 있는 핵심어 천이 확률을 계산하여 시스템에 적용 실험한다. 제안한 시스템의 성능 평가를 위해 태스크 도메인에 활용되는 4,970 문장의 코퍼스를 구축하고, 이용자 중 20대∼30대 5명이 발성하게 하여 실험한 결과, 제안한 5 음소군에 가중치를 부여한 방법의 FOM은 87.5%로 Yapanel[1]의 7음소군 85.5%보다 우수한 성능을 보였으나, LVCSR의 89.8%보다는 약간 뒤지는 성능을 확인하였다. 계산시간에 있어서도 0.70초로 7음소군의 0.72초보다 우수한 성능을 보였다. 핵심어 천이 확률 분석을 통한 인식 시간 단축 실험에서는 천이 확률을 적용했을 때 약 0.04초∼0.07초의 처리 시간을 단축하는 것을 확인하였다.

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

뇌자기공명영상 검사를 통해 조기 발견된 제2형 뮤코다당증 1례 (A Case of Mucopolysaccharidosis Type 2 Diagnosed Early through Brain MRI)

  • 이윤경;조성윤;김진섭;허림;진동규
    • 대한유전성대사질환학회지
    • /
    • 제15권2호
    • /
    • pp.87-92
    • /
    • 2015
  • 뮤코다당증(mucopolysaccharidosis)은 글리코사미노글리칸(glycosaminoglycans)의 분해에 필요한 리소좀 효소의 결함으로 인해 야기되는 질병으로 글리코사미노글리칸의 대사 산물이 세포의 리소좀 내에 축적되어 세포, 조직 그리고 기관의 기능 이상을 초래해 신체적, 신경학적인 퇴행을 보이며, 심한 경우 조기에 사망하게 되는 다양한 임상양상을 보이는 질환이다. 뮤코다당증 가운데 가장 높은 비율을 차지하는 헌터증후군(뮤코다당증 제2형)은 조기에 진단하여 효소보충요법을 시행하는 것이 중요하다. 본 증례는 언어발달지연과 등과 엉덩이에 몽고반점, 간비대, 두껍고 거친 피부가 있었으며 과성장된 신체 검진소견을 보였던 환아에서, 뇌자기공명영상 검사 결과에서 뇌교량체에 다수의 낭종, 백색질에 비정상 신호 증가 병변들, 미만성 뇌수축 소견을 보여 헌터증후군을 의심하였으며 효소검사 결과를 통해 확진하였다. 저자들은 언어발달지연을 주소로 내원한 환아에게 시행한 뇌자기공명영상에서 조기에 헌터증후군을 의심하여 효소검사를 통해 확진을 할 수 있었던 증례를 경험하였기에 이를 보고하는 바이다.

대용량 자원 기반 과학기술 핵심개체 탐지를 위한 정보추출기술 통합에 관한 연구 (A Study on the Integration of Information Extraction Technology for Detecting Scientific Core Entities based on Large Resources)

  • 최윤수;정창후;최성필;류범종;김재훈
    • 정보관리연구
    • /
    • 제40권4호
    • /
    • pp.1-22
    • /
    • 2009
  • 대용량 문서에서 정보를 추출하는 작업은 정보검색 분야 뿐 아니라 질의응답과 요약분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로써, 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 생의학 분야 과학기술 문헌을 분석하여 전문용어 및 개체명 등을 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다. 전체 플랫폼의 성능을 체계적으로 평가하기 위해서, KEEC 2009를 비롯한 다양한 말뭉치를 기반으로 세부 요수 모듈에 대한 성능 평가를 수행하였으며, 비교적 높은 수준의 성능을 확보하였다. 본 논문에서 개발된 핵심개체자동인식 플랫폼은 정보검색, 질의응답, 문서색인, 사전구축 등 다양한 정보서비스 분야에 활용될 수 있다.

홍삼, 천마, 적하수오 병용투여에 의한 고지혈증 랫드에서의 콜레스테롤 및 발기부전 개선효과 (Beneficial effect of Combination with Korean Red Ginseng, Gastrodia Rhizoma and Polygoni Multiflori on Cholesterol and Erectile Dysfunction in Hyperlipidemia rats)

  • 이윤정;고민철;담서;이재윤;황진석;차정단;최경민;강대길
    • 대한본초학회지
    • /
    • 제30권6호
    • /
    • pp.69-75
    • /
    • 2015
  • Objectives : This study was designed to investigate effects of the combination with Korean Red Ginseng (Panax ginseng C.A. Meyer), Gastrodia Rhizoma (Gastrodia elata Blume) and Polygoni Multiflori Radix (Polygonum multiflorum Thunberg) on metabolic disorders including cholesterol and erectile dysfunction in hyperlipidemia rats.Methods : Animals were divided into six groups; Control with normal diet, high fat/cholesterol-diet (HFCD), fluvastatin, Korean Red Ginseng treated (KRG), and the combination treated (Korean Red Ginseng, Gastrodia Rhizoma and Polygoni Multiflori Radix; 1:1:1 for KGP1 and 2:1:1 for KGP2). The experimental groups initially received HFCD for 10 weeks and then treated orally with fluvastatin, KRG, KGP1 and KGP2 during the final 6 weeks. Erectile function was determined by the measurements of intracavernosal pressure (ICP) and maximal arterial pressure (MAP) after electrical stimulation of the cavernosal nerve.Results : KGP2 decreased the level of total cholesterol and LDL cholesterol in the sera of HFCD rats without no changes of body weights. KRG, KGP1 and KGP2 decreased the level of C-reactive protein (CRP) levels except of fluvastatin, synthetic HMG-CoA reductase inhibitor. KRG, KGP1 and KGP2 significantly increased the ICP, ICP/MAP ratio, area under the curve (AUC) compared with those of normal rat. Morphometric analyses showed that KRG, KGP1 and KGP2 increased the volume of smooth muscle and the regular arrangement of collagen fibers in corpus cavernosum of HFCD rats. The penile expression of eNOS was increased by KRG, KGP1 and KGP2.Conclusions : Based on these results, we suggest that the combination with Korean Red Ginseng, Gastrodia Rhizoma and Polygoni Multiflori may improve hyperlipidemia through regulating the lipid profiles and erectile dysfunction in rats.

대상회전 기타 피질이 손상된 흰쥐들의 행동 변화 (Behavioral Changes of Rats following Cingulate or Other Cortical Damages)

  • 김정진;김종규;김명석
    • The Korean Journal of Physiology
    • /
    • 제2권2호
    • /
    • pp.83-92
    • /
    • 1968
  • A study was planned to evaluate the effects of removal of the cingulate cortex upon the occurrence of any behavior commonly displayed by the rat, and to compare the effects of cingulectomy with those of removal of the parietal, parieto-occipital, or occipital regions. The subjects were 54 male albino rats (Holtzman strain, body weight $200{\sim}330\;gm$) including 14 rats in which the cingulate gyri between splenium and genu of the corpus callosum were bilaterally ablated by suction (cingulate group), 9 animals which had their parietal cortices (chiefly area 7) partially removed (parietal group), 9 rats whose parietal and occipital regions (chiefly areae 7 & 17), 13 animals in which the occipital cortices (chiefly area 17) were removed bilaterally (occipital group), and 9 normal rats (normal control group). Eighteen observation cages, each of which housed a subject and was provided with food and water ad lib., were arranged in 6 rows on a rack and the behavior of each subject was scanned by an observer at a distance of 1.5 m from the rack. The observer scanned the first and second rows 6 times in 1 min, then proceeded to the 3rd and 4th rows, scanning for another 1 min, and finally to the 5th and 6th rows. The speed of scanning was such that behavioral observations of all of the 18 rats were completed in 3 min, each subject receiving 6 observations. The scanning was repeated every 3 min for 18 min, which constituted one observation session and was followed by a 72 minutes' recess. The whole procedure was repeated through 24 hours so that a total of 576 behavioral observations were made on each subject in 16 observation sessions. Behaviors checked were sleeping, lying, lying and sniffing, standing, standing and sniffing, exploring, eating, drinking, grooming (included were washing, licking, and scratching), and others. Results obtained were as follows: 1. The cingulate group ate significantly more often than the normal control, the parietal, and the parieto-occipital groups. 2. Exploration was significantly less frequent in the cingulate group than in the normal control, the parietal, and the occipital groups. There was, in the case of the cingulate group, a significant negative correlation between the occurrence of eating and the exploratory activity. 3. The general activity, as judged from the value obtained by adding the occurrence of exploration, eating, drinking, grooming, and standing and sniffing, was significantly increased in the cingulate group compared with those of any other groups including the normal control. 4. Though statistically insignificant, the cingulate group slept least often among all the animal groups tested. 5. The parieto-occipital group tended to groom less, and the parietal group to eat less often than the normal control group did, but the difference was not significant. There were no significant differences among all the groups except the cingulate group as regards other behaviors analyzed. Based on the above results, it was inferred that the cingulate cortex exerts an inhibitory influence upon the occurrence of eating and general activity, while it tends to facilitate the occurrence of sleep.

  • PDF