• Title/Summary/Keyword: 연어추출

Search Result 46, Processing Time 0.023 seconds

Verbal Collocation Extraction from Sejong Tagged Corpus (세종 말뭉치로부터 용언연어 추출)

  • Lee, Jeong-Tae;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.121-123
    • /
    • 2015
  • 연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

  • PDF

Extracting Collocations Using Entropy in Korean (엔트로피를 이용한 한국어 연어 추출)

  • 박경미;송만석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.451-453
    • /
    • 2002
  • 연어는 습관적으로 같이 자주 나타나는 단어열로 각 단어로 분리하기보다 통합해 처리하는 것이 효율적이기 때문에 기계 번역과 음성 인식등에서 유용만 정보로 사용된다. 이러한 연어를 추출하기 위해 본 논문에서는 2가지 경우를 고려했는데, 첫 번째로 인어를 말뭉치에 자주 나타나는 단어열이라고 했을 때 단어열들의 엔트로피가 일정값 이상이면 연어로 추출했다 두 번째로 통사적 제약이 있는 연어를 주술하기 위해 앞 또는 뒤에 올 단어를 제약하는 단어의 엔트로피를 구해 일정값 미만이면 그 단어를 포함한 단어열을 연어로 추출했다. 실험은 품사 부착된 HANTCE 말뭉치를 가지고 수행했고, 젓 번째 방법으로 실험했을 때 엔드로피가 2이상인 단어열을 가지고 분리된 연어도 유도해냈다.

  • PDF

Automatic Extraction of Collocations based on Corpus using mutual information (말뭉치에 기반한 상호정보를 이용한 연어의 자동 추출)

  • Lee, Ho-Suk
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.4
    • /
    • pp.461-468
    • /
    • 1994
  • This paper describes the automatic extraction of collocations based on corpus. The collocations are extracted from corpus using cooccurrence frequency and mutual information between words. In English, 5 types of collocations are defined. These collocations are transitive verb and object, intransitive verb and subject, adjective and noun, verb and adverb, and adverb and adjective. In this paper another type of collocation is recognized and extracted, which consists of verb and preposition. So 6 types of collocations are extracted based on corpus.

  • PDF

The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools (통계 기법을 이용한 연어 추출 모형 연구)

  • Ahn, Sung-Min
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.162-165
    • /
    • 2010
  • 공기하여 나타나는 구 정보 중에서 언어에 대한 연구는 응용 언어학에 발전에 기여할 수 있는 부분이 크다. 연어란 어휘들 간의 제한된 결합 관계를 갖는 공기 확률이 높은 구 구성이다. 이러한 연어 구성에 대한 연구는 특히 기계 번역이나 사전 편찬 등의 분야에서 관심이 높아지고 있다. 본 연구에서는 언어를 추출하기 위해 T-test와 상호 정보, 조건 확률 등의 여러 통계 기법의 사용을 제시한다. 각 기법을 적용하였을 때 연어 추출에 어떠한 변화를 보이는지 조사하였고, 가장 적절한 기법의 적용도 모색함으로써 향후 언어 추출의 방향을 제시하고자 한다.

  • PDF

Java API Pattern Extraction and Recommendation using Collocation Analysis (연어 관계 분석을 통한 Java API 패턴 추출 및 추천 방법)

  • Kwon, Chanwoo;Hwang, Sangwon;Nam, Youngkwang
    • Journal of KIISE
    • /
    • v.44 no.11
    • /
    • pp.1165-1177
    • /
    • 2017
  • Many developers utilize specific APIs to develop software, and to identify the use of a particular API, a developer can refer to a website that provides the API or can retrieve the API from the web. However, the site that provides the API does not necessarily provide guidance on how to use it while it can be partially provided in many other cases. In this paper, we propose a novel system JACE (Java AST collocation-pattern extractor) as a method to reuse commonly-used code as a supplement. The JACE extracts the API call nodes, collocation patterns and analyzes the relations between the collocations to extract significant API patterns from the source code. The following experiment was performed to verify the accuracy of a defined pattern: 794 open source projects were analyzed to extract about 15M API call nodes. Then, the Eclipse plug-in test program was utilized to retrieve the pattern using the top 10 classes of API call nodes. Finally, the code search results from reference pages of the API classes and the Searchcode [1] were compared with the test program results.

Antioxidant Effect of Anserine Extracted from Salmon (Oncorhynchus keta) (연어(Oncorhynchus keta) 추출 anserine의 항산화 효과)

  • Min, Hye-Ok;Song, Ho-Su
    • Journal of Food Hygiene and Safety
    • /
    • v.34 no.4
    • /
    • pp.396-403
    • /
    • 2019
  • Ion-exchange chromatography and ultrafiltration were used to extract anserine from salmon (Oncorhynchus keta). The salmon anserine showed DPPH radical scavenging activity in the range of 7.30% to 31.05% in a dose-dependent manner. This reducing power of salmon anserine also increased as the concentration increased. Metal chelate activity, superoxide dismutase - like activity, and thiobarbituric acid reactive substances assay showed similar results. The anserine also suppressed the increment of the peroxide value and linoleic acid during storage periods. These results suggest that salmon anserine might be useful as a natural antioxidant in various foodstuffs.

A Korean Corpus Analysis Tool for Language Information Acquisition (언어 정보 획득을 위한 한국어 코퍼스 분석 도구)

  • Lee, Ho;Kim, Jin-Dong;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.297-304
    • /
    • 1994
  • 코퍼스는 기계 가독형으로 개장되어 있는 실제 사용 언어의 집합으로 자연어 처리에 필요한 여러 가지 언어 정보를 내재하고 있다. 이들 정보는 코퍼스 분석기를 이용하여 획득할 수 있으며 용례와 각종 통계 정보 및 확률 정보, 연어 목록 등은 코퍼스에서 추출할 수 있는 대표적인 언어 정보들이다. 그러나 기존의 한국어 코퍼스 분석 도구들은 용례 추출 기능만을 보유하여 활용 범위가 제한되어 있었다. 이에 본 논문에서는 대량의 한국어 코퍼스를 분석하여 용례뿐만 아니라 자연어 처리의 제분야에서 필요한 언어 정보들을 추출하는 방법에 대해 연구하였으며 이의 검증을 위해 KCAT(Korean Corpus Analysis Tool)를 구현하였다. KCAT는 코퍼스 색인, 용례 추출, 통계 정보 추출, 연어 추출 부분으로 구성되어 있다. 용례 색인을 위해서는 여러 가지 사전과 용례 색인 구조가 필요한데 KCAT에서는 가변 차수 B-Tree 구조를 이용하여 사전을 구성하며 용례 색인을 위해 버킷 단위의 역 화일 구조를 이용한다. 질 좋은 용례의 추출을 위해 KCAT는 다양한 용례 연산 및 정렬 기능을 제공한다. 또한 통계적 방법의 자연어 처리 분야를 위해 어휘 확률, 상태 전이 확률, 관측 심볼 확률, 상호 정보, T-score 등을 제공하며, 기계 번역 분야에서 필요한 연어를 추출한다.

  • PDF

Improvement on the Functional Properties of Gomtang-like Product from Salmon Frame Using Commercial Enzymes (상업적 효소를 이용한 연어 Frame 유래 곰탕 유사 제품의 기능성 개선)

  • Heu, Min-Soo;Park, Shin-Ho;Kim, Hye-Suk;Jee, Seung-Joon;Lee, Jae-Hyoung;Kim, Hyung-Jun;Han, Byung-Wook;Kim, Jin-Soo
    • Journal of the Korean Society of Food Science and Nutrition
    • /
    • v.36 no.12
    • /
    • pp.1596-1603
    • /
    • 2007
  • This study was conducted to improve functional properties of salmon frame extracts using various commercial enzymes (Alkalase 2.4 L FG, Flavourzyme 500 MG, Neutrase 0.8 L and Protamex 1.5 MG). The ACE (angiotensin I converting enzyme) inhibitory activity was the highest ($IC_{50}=0.67mg/mL$) in the product incubated with Neutrase for 4 hrs (N4-treated hydrolysates) among the various extracts incubated with commercial enzymes for different times. However, antioxidant activities of all salmon frame extracts were less than 15%. There were no significant differences in the proximate composition and sensory evaluation of the fish odor and taste. However, N4-treated hydrolysate was improved in the extractive-nitrogen content and transmission compared to the other enzymatic hydrolysates. When compared to commercial Gomtang products, N4-treated hydrolysate was also high in protein, extractive-nitrogen, total amino acid, and calcium contents, while low in taste sensory score. There were no differences in transmission and sensory score on the fish odor between N4-treated hydrolysates and commercial Gomtang.

Characteristics of Hot-Water Extracts from Salmon Frame as Basic Ingredients for Gomtang-like Products (열수추출 연어 Frame 엑스분의 곰탕 유사 제품 베이스로서의 특성)

  • Han, Byung-Wook;Kim, Hye-Suk;Jee, Seung-Joon;Lee, Jae-Hyoung;Kim, Hyung-Jun;Park, Shin-Ho;Ji, Seong-Gil;Heu, Min-Soo;Kim, Jin-Soo
    • Journal of the Korean Society of Food Science and Nutrition
    • /
    • v.36 no.10
    • /
    • pp.1326-1333
    • /
    • 2007
  • For preparing the basic ingredients of Gomtang-like products from the extracts of salmon frame, the extraction conditions of salmon frame were examined, and the characteristics of the extracts were compared with commercial Gomtang. Based on the crude protein, Ex-N and sensory attributes, the extractions were optimized by extracting pretreated-salmon frame in 12 times (v/w) of water for 12 hrs, before filtering with cheese cloth to yield 3 times the volume of the raw material. The concentrations of heavy metals in extracts from salmon frame were below the safety limits suggested by KFDA. The mai or amino acids were glutamic acid and aspartic acid as the free amino acids, and glycine, proline, and glutamic acid as the total amino acids. The calcium and phosphorus contents were 18.0 mg/100 mL and 33.1 mg/100 mL, respectively, and they accounted for 20% and 18% of the recommended daily allowance for mineral intake. The angiotensin I converting enzyme (ACE) inhibitory activity was improved by incubation with Flavourzyme for 4 hrs and its $IC_{50}$ was 2 mg/mL. The results above suggested that the enzymatic hydrolysates from extracts of salmon frame could be used as a basic ingredient for preparing Gomtang-like products.

An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information (사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구)

  • Lee, Yong-Gu;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.1 s.63
    • /
    • pp.321-342
    • /
    • 2007
  • This study presents an effective word sense disambiguation model that does not require manual sense tagging Process by automatically tagging the right sense using a machine-readable and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09% The combined 1a99ing method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.