• 제목/요약/키워드: 연어추출

검색결과 46건 처리시간 0.022초

세종 말뭉치로부터 용언연어 추출 (Verbal Collocation Extraction from Sejong Tagged Corpus)

  • 이정태;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-123
    • /
    • 2015
  • 연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

  • PDF

엔트로피를 이용한 한국어 연어 추출 (Extracting Collocations Using Entropy in Korean)

  • 박경미;송만석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.451-453
    • /
    • 2002
  • 연어는 습관적으로 같이 자주 나타나는 단어열로 각 단어로 분리하기보다 통합해 처리하는 것이 효율적이기 때문에 기계 번역과 음성 인식등에서 유용만 정보로 사용된다. 이러한 연어를 추출하기 위해 본 논문에서는 2가지 경우를 고려했는데, 첫 번째로 인어를 말뭉치에 자주 나타나는 단어열이라고 했을 때 단어열들의 엔트로피가 일정값 이상이면 연어로 추출했다 두 번째로 통사적 제약이 있는 연어를 주술하기 위해 앞 또는 뒤에 올 단어를 제약하는 단어의 엔트로피를 구해 일정값 미만이면 그 단어를 포함한 단어열을 연어로 추출했다. 실험은 품사 부착된 HANTCE 말뭉치를 가지고 수행했고, 젓 번째 방법으로 실험했을 때 엔드로피가 2이상인 단어열을 가지고 분리된 연어도 유도해냈다.

  • PDF

말뭉치에 기반한 상호정보를 이용한 연어의 자동 추출 (Automatic Extraction of Collocations based on Corpus using mutual information)

  • 이호석
    • 한국정보처리학회논문지
    • /
    • 제1권4호
    • /
    • pp.461-468
    • /
    • 1994
  • 본 논문은 말뭉치에 기반한 연어의 자동 추출에 관한 연구이다. 연어는 말뭉치로 부터 단어의 동시발생빈도(cooccurrence frequency)와 상호정보 (mutual informaton) 를 이용하여 추출하였다. 영어에는 5가지 종류의 연어가 정의 되어 있다. 이들은 타동 사와 목적어, 자동사와 주어, 형용사와 명사, 동사와 부사 그리고 형용사와 부사이다. 여기에 동사와 전치사의 단어쌍을 새롭게 연어로 파악하여 6가지 종류의 연어를 추출 하였다.

  • PDF

통계 기법을 이용한 연어 추출 모형 연구 (The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools)

  • 안성민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.162-165
    • /
    • 2010
  • 공기하여 나타나는 구 정보 중에서 언어에 대한 연구는 응용 언어학에 발전에 기여할 수 있는 부분이 크다. 연어란 어휘들 간의 제한된 결합 관계를 갖는 공기 확률이 높은 구 구성이다. 이러한 연어 구성에 대한 연구는 특히 기계 번역이나 사전 편찬 등의 분야에서 관심이 높아지고 있다. 본 연구에서는 언어를 추출하기 위해 T-test와 상호 정보, 조건 확률 등의 여러 통계 기법의 사용을 제시한다. 각 기법을 적용하였을 때 연어 추출에 어떠한 변화를 보이는지 조사하였고, 가장 적절한 기법의 적용도 모색함으로써 향후 언어 추출의 방향을 제시하고자 한다.

  • PDF

연어 관계 분석을 통한 Java API 패턴 추출 및 추천 방법 (Java API Pattern Extraction and Recommendation using Collocation Analysis)

  • 권찬우;황상원;남영광
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1165-1177
    • /
    • 2017
  • 소프트웨어 개발 진행 시 개발자는 다양한 방법으로 API의 사용 방법을 검색하지만, 원하는 검색 결과를 얻지 못하는 경우가 많다. 이러한 문제를 해결하기 위해, 본 연구에서는 추상구문트리의 연어 관계를 이용하여 API 패턴을 추출하고 이를 추천하는 시스템 JACE(Java AST Collocation-pattern Extractor)를 개발하였다. JACE는 자바 추상구문트리를 분석하여 API 호출 노드를 추출한 후, 노드 간 연어 관계를 분석하고 연어 관계 사전을 구축한다. 구축된 연어 관계 사전을 이용하여 연어 관계 리스트를 생성하고 이것을 패턴으로 정의한다. 정의된 패턴은 이클립스 플러그인으로 제작된 테스트 프로그램을 통하여 사용자 요청 시 추천된다. 실험을 위해 794개의 오픈소스 프로젝트를 분석하였고, 약 1천 5백만개의 API 호출 노드를 추출하여 실험하였다. 결과적으로, 기존 검색 시스템들보다 더 유용한 예제 코드 및 사용법을 제시하였다.

연어(Oncorhynchus keta) 추출 anserine의 항산화 효과 (Antioxidant Effect of Anserine Extracted from Salmon (Oncorhynchus keta))

  • 민혜옥;송호수
    • 한국식품위생안전성학회지
    • /
    • 제34권4호
    • /
    • pp.396-403
    • /
    • 2019
  • 연어로부터 추출한 anserine의 항산화능 평가를 위해 1차 이온교환 후 한외여과 및 2차 이온교환 추출물인 IEC-B 실험구와 합성 anserine, ${\beta}-alanine$, 1-methylhistidine, taurine, ascorbic acid, BHT를 대조구로 DPPH 라디칼 소거능, 환원력, 금속 킬레이트능, SOD 유사활성 실험을 하였다. DPPH 라디칼 소거능 결과 대조구와 anserine 모두 농도 증가에 따라 라디칼 소거능이 증가하였으며 BHT가 가장 높은 소거능을 나타냈다. 합성 anserine은 농도 증가에 따라 $9.30{\pm}0.65{\sim}28.23{\pm}0.24%$를 나타냈으며 연어 추출 anserine인 IEC-B 추출물은 $7.30{\pm}1.13{\sim}31.05{\pm}0.17%$를 나타내 BHT, ascorbic acid에 비해 소거능이 낮으나 두 실험구와 비교했을 때 약 37%, 49% 정도의 소거능을 나타냈다. 환원력 또한 첨가농도에 따라 증가하였으며 BHT와 ascorbic acid가 높은 환원력을 나타냈고, 그 외 실험구 중에서는 합성 anserine과 연어 추출 anserine인 IEC-B 실험구가 높았으며 유의적으로 동일한 환원력을 나타냈다. 금속 킬레이트능은 BHT, ascorbic acid 순으로 높았으며 합성 anserine과 연어 추출 anserine의 경우 ascorbic acid와 유사한 금속 킬레이트능을 나타냈다. 또한 SOD 유사활성에서는 연어 추출 anserine이 BHT와 ascorbic acid에 비해 낮았으나 농도 증가에 따라 증가하는 경향을 나타내었으며, 합성 anserine, 연어 추출 anserine, ascorbic acid, BHT를 이용하여 과산화물가와 TBARS를 실험하였다. 저장기간 중 linoleic acid의 과산화물가는 큰 폭으로 증가한 반면 연어 추출 anserine을 첨가한 경우 과산화물가의 증가가 억제되는 경향이 나타났으며, 이는 TBARS 실험 결과와 유사한 경향을 나타냈다.

언어 정보 획득을 위한 한국어 코퍼스 분석 도구 (A Korean Corpus Analysis Tool for Language Information Acquisition)

  • 이호;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.297-304
    • /
    • 1994
  • 코퍼스는 기계 가독형으로 개장되어 있는 실제 사용 언어의 집합으로 자연어 처리에 필요한 여러 가지 언어 정보를 내재하고 있다. 이들 정보는 코퍼스 분석기를 이용하여 획득할 수 있으며 용례와 각종 통계 정보 및 확률 정보, 연어 목록 등은 코퍼스에서 추출할 수 있는 대표적인 언어 정보들이다. 그러나 기존의 한국어 코퍼스 분석 도구들은 용례 추출 기능만을 보유하여 활용 범위가 제한되어 있었다. 이에 본 논문에서는 대량의 한국어 코퍼스를 분석하여 용례뿐만 아니라 자연어 처리의 제분야에서 필요한 언어 정보들을 추출하는 방법에 대해 연구하였으며 이의 검증을 위해 KCAT(Korean Corpus Analysis Tool)를 구현하였다. KCAT는 코퍼스 색인, 용례 추출, 통계 정보 추출, 연어 추출 부분으로 구성되어 있다. 용례 색인을 위해서는 여러 가지 사전과 용례 색인 구조가 필요한데 KCAT에서는 가변 차수 B-Tree 구조를 이용하여 사전을 구성하며 용례 색인을 위해 버킷 단위의 역 화일 구조를 이용한다. 질 좋은 용례의 추출을 위해 KCAT는 다양한 용례 연산 및 정렬 기능을 제공한다. 또한 통계적 방법의 자연어 처리 분야를 위해 어휘 확률, 상태 전이 확률, 관측 심볼 확률, 상호 정보, T-score 등을 제공하며, 기계 번역 분야에서 필요한 연어를 추출한다.

  • PDF

상업적 효소를 이용한 연어 Frame 유래 곰탕 유사 제품의 기능성 개선 (Improvement on the Functional Properties of Gomtang-like Product from Salmon Frame Using Commercial Enzymes)

  • 허민수;박신호;김혜숙;지성준;이재형;김형준;한병욱;김진수
    • 한국식품영양과학회지
    • /
    • 제36권12호
    • /
    • pp.1596-1603
    • /
    • 2007
  • 연어 frame 추출물에 대하여 건강 기능성 개선을 위하여 4종의 상업적 효소(Alcalase, Flavourzyme, Neutrase 및 Protamex) 처리에 의한 건강 기능성 연어 frame 가수분해물의 개발을 시도하였다. 연어 frame 가수분해물의 ACE 저해능($IC_{50}$)은 Neutrase로 4시간 처리한 가수분해물이 0.67 mg/mL로 가장 우수하였으나, 항산화성은 기대 이하의 범위(15% 이하)이었다. Neutrase 처리 연어 frame 가수분해물은 무처리 추출물에 비하여 일반성분과 관능적 특성(비린내 및 맛)에 있어서 차이가 없었으나 추출물 질소 함량은 높았고, 투과도는 개선되었다. 효소처리 연어 frame 가수분해물은 축육과 뼈로 제조한 시판 곰탕에 비하여 단백질 함량, 추출물 질소, 구성아미노산과 칼슘 함량이 높았고, 투과도, 관능적 비린내 등에서는 차이가 없었으며, 추후 조미 등에 의하여 보강 가능한 관능적 맛은 기호도에 있어 약간 차이가 있었다. 이상의 결과로 미루어 보아 연어 frmae 추출물에 Neutrase로 4시간 처리함으로 인하여 투과도와 ACE 저해능과 같은 건강 기능성은 기대할 수 있으리라 판단된다.

열수추출 연어 Frame 엑스분의 곰탕 유사 제품 베이스로서의 특성 (Characteristics of Hot-Water Extracts from Salmon Frame as Basic Ingredients for Gomtang-like Products)

  • 한병욱;김혜숙;지성준;이재형;김형준;박신호;지승길;허민수;김진수
    • 한국식품영양과학회지
    • /
    • 제36권10호
    • /
    • pp.1326-1333
    • /
    • 2007
  • 연어 훈제 가공품의 제조 중 부산물로 발생하는 연어 frame을 곰탕 유사 제품과 같이 보다 효율적으로 이용할 목적으로 연어 frame 엑스분의 제조를 시도하였고, 아울러 이의 특성을 시판 제품과 비교 검토하였다. 연어 frame 엑스분은 연어 frame에 대하여 12배의 가공용수를 가한고, 12시간 동안 열수추출하여, 원심분리 및 정용(추출을 위하여 사용한 가공용수의 25%로 정용)하여 제품화 하는 것이 가장 좋았다. 최적조건에서 제조한 연어 frame 엑스분은 중금속적인면에서는 안전한 범위이었고, 주 맛성분은 glutamic acid와 aspartic acid등이었다. 또한, 연어 frame엑스분의 주요 총아미노산은 glycine, proline 및 glutamic acid 등이었고, 칼슘과 인의 함량은 $1{\sim}2$인분 기준(시판 제품에서 $1{\sim}2$인용으로 시판되는 용량인 500mL 기준)에서 1일 권장량의 약 20% 및 18%에 해당하는 함량이었다. 연어 frame엑스분은 고혈압 억제능인 ACE 저해능은 거의 인정되지 않았으나, 이를 Flavourzyme으로 4시간 가수분해하는 경우 ACE 저해능$(IC_{50}=2mg/mL)$이 상당히 개선되었다. 그러나 연어 frame 엑스분의 고혈압 저해능을 기대하기 위하여는 적절한 가수 분해 조건의 구명이 동반되어야 하리라 판단되었다. 이상의 결과로 미루어 보아 연어 frame에 대하여 12배의 가공용수를 가하고, 12시간 동안 열수추출하여, 원심분리 및 정용(연어 frame에 대하여 3배에 해당하는 용량)한 다음 적절히 효소 가수분해하는 경우 곰탕 유사 제품의 베이스로 사용 가능하리라 판단되었다.

사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구 (An Experimental Study on an Effective Word Sense Disambiguation Model Based on Automatic Sense Tagging Using Dictionary Information)

  • 이용구;정영미
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.321-342
    • /
    • 2007
  • 이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.