• 제목/요약/키워드: CRF++

검색결과 352건 처리시간 0.022초

ELECTRA-CRFs 기반 한국어 개체명 인식기 (Korean Named Entity Recognition based on ELECTRA with CRFs)

  • 홍지연;김현우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.473-476
    • /
    • 2020
  • 개체명 인식에 적용된 대부분의 신경망 모델들에서 CRFs와 결합을 통해 성능 향상을 하였다. 그러나 최근 대용량 데이터로 사전 학습한 모델을 활용하는 경우, 기 학습된 많은 유의미한 파라미터들로 인해 CRFs의 영향력이 비교적 작아졌다. 따라서 본 논문에서는 한국어 대용량 말뭉치로 사전 학습한 ELECTRA 모델에서의 CRFs 가 개체명 인식에 미치는 영향을 확인해보고자 한다. 모델의 입력 단위로 음절 단위와 Wordpiece 단위로 사전 학습된 두 가지의 모델을 사용하여 미세 조정을 통해 개체명 인식을 학습하였다. 실험을 통해서 두 모델에 대하여 각각 CRFs 층의 유무에 따른 성능을 비교해 보았다. 그 결과로 ELECTRA 기반으로 사전 학습된 모델에서 CRFs를 통한 F1-점수 향상을 보였다.

  • PDF

ELECTRA와 Label Attention Network를 이용한 한국어 개체명 인식 (Korean Named Entity Recognition Using ELECTRA and Label Attention Network)

  • 김홍진;오신혁;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-336
    • /
    • 2020
  • 개체명 인식이란 문장에서 인명, 지명, 기관명 등과 같이 고유한 의미를 갖는 단어를 찾아 개체명을 분류하는 작업이다. 딥러닝을 활용한 연구가 수행되면서 개체명 인식에 RNN(Recurrent Neural Network)과 CRF(Condition Random Fields)를 결합한 연구가 좋은 성능을 보이고 있다. 그러나 CRF는 시간 복잡도가 분류해야 하는 클래스(Class) 개수의 제곱에 비례하고, 최근 RNN과 Softmax 모델보다 낮은 성능을 보이는 연구도 있었다. 본 논문에서는 CRF의 단점을 보완한 LAN(Label Attention Network)와 사전 학습 언어 모델인 음절 단위 ELECTRA를 활용하는 개체명 인식 모델을 제안한다.

  • PDF

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

중풍변증표준안 진료기록부 임상적용을 위한 증례기록부와 표준작업지침서의 개선과정 (Improvement of Tentative Korean Standard Differentiation of the Symptoms and Signs for Stroke for Clinical Application)

  • 이민구;강병갑;김보영;고호연;최선미;설인찬;조현경;윤종민;문병순;이인
    • 동의생리병리학회지
    • /
    • 제21권1호
    • /
    • pp.347-351
    • /
    • 2007
  • This study was done to report the improvement of second case report form(CRF) and standard operating procedure(SOP) of Tentative Korean Standard Differentiation of the Symptoms and Signs for Stroke. We were in charge of developing case report form(CRF) and educating the investigators. In the process of this project, we needed to develop standard operating procedure(SOP) for this CRF. So we made Tentative Korean Standard Differentiation of the Symptoms and Signs for Stroke and tried clinical application at Department of Oriental Internal Medicine of Wonkwang University and Daejeon University in 2005. And in this pilot study we can find out some problems and need to improve it. We strengthen the incision and exclusion criteria of CRF We canceled the Chief complains entry for efficiency. We reflected the decision of Stroke standard committee. We reduced the differentiation index of CRF to promote efficiency and accuracy. We rearranged the order of the differentiation index to promote rationality and practicality. We regulated detail item belonging to Differentiation index. We used a colloquialism in question. We inserted flow chart in SOP. We inserted picture of diagnostic index.

자연실온 및 변온 조건에서 세엽형 훼스큐속 잔디의 발아특성 및 일일 발아패턴 비교 (Comparison of Germination Characteristics and Daily Seed Germinating Pattern in Fine-textured Fescues Grown Under Alternative and Natural Conditions at the Room Temperature)

  • 김경남
    • Weed & Turfgrass Science
    • /
    • 제2권1호
    • /
    • pp.47-54
    • /
    • 2013
  • 본 실험은 자연실온 환경에서 세엽형 훼스큐 초종 간 초기 발아특성 및 발아패턴을 조사하고 변온 및 자연실온에서의 그 차이점을 비교 분석해서 실무 시공에 응용할 수 있는 기초자료를 파악하고자 시작하였다. 공시재료는 츄잉스 훼스큐(CF), 크리핑 레드 훼스큐(CRF), 하드 훼스큐(HF) 및 쉽 훼스큐(SF)에서 선정한 6품종 이었으며, 일일 발아패턴 및 누적 발아패턴을 1일 간격으로 조사하였다. 화인 훼스큐 종자의 발아율, 발아패턴 및 발아 특성은 생육환경, 초종 및 품종에 따라 유의한 차이가 크게 나타났다. 자연실온에서 발아력은 ISTA 변온과 다르게 나타났고 최종 발아율은 29.7~80.0% 사이로 다양하였다. 발아패턴은 최초 발아의 경우 ISTA 변온에 비해 3~4일 늦은 치상 후 8~10일 사이에 시작되었다. 발아율 50% 도달한 기간은 최초 발아 후 2~5일 경과 후인 치상 후 11~14일 사이로 ISTA 변온에 비해 3~4일 정도 늦게 나타났다. 또한 실무적으로 요구되는 발아율 60% 도달기간은 ISTA 변온에 비해 초종에 따라 3.0~4.2일 정도 늦은 치상 후 12.1~19.0일 사이로 나타났다. 공시 초종 중 60% 발아율 도달 기간이 가장 빠른 품종은 CF 'Jamestown II' 품종이었고, 반대로 가장 느린 종류는 CRF 'Audubon' 품종이었다. 자연실온 환경에서 화인 훼스큐 초종 간 조성 속도는 CRF < SF < HF < CF 순서로 나타났다. 본 실험을 통해 밝혀진 초종 및 품종 간 이러한 생리생태적 특성 차이 및 비교 자료는 골프장 등 잔디밭 조성 시 실무적인 기초 자료로 유용하게 활용될 수 있을 것이다.

개의 만성 신부전에서 대황 추출물의 치료학적 효과의 평가 (Evaluation of Therapeutic Effect of the Extract from Rhubarb (Rheum officinalis) in Dogs with Chronic Renal Failure)

  • 김예원;현창백
    • 한국임상수의학회지
    • /
    • 제29권6호
    • /
    • pp.435-440
    • /
    • 2012
  • 이번 연구는 만성신부전이 있는 개에서 대황 추출물($Rubenal^{(R)}$)의 치료적 효과와 부작용을 평가하기 위해서 실시되었다. 보호자가 있는 만성신부전 IRIS II-III 단계의 개 40마리가 이번 연구에서 사용되었다. 개들에게 동일한 모양의 대황 추출물과 위약을 투여한 후 0, 30, 90, 180일 동안 관찰, 평가하였다: BSC, 임상적 평가(식욕, 다음/다뇨, QOL), 혈액 검사(WBC, RBC, PCV), 혈청화학검사(ALT/AST, ALP, Creatinine /BUN, Total protein, albumin), 전해질검사(Na, K, Cl, Ca, iCa, P), 혈압, 요검사(UPC, 요비중) 그리고 IRIS 단계를 평가하였다. 이번 연구에서 개들에게 대황 추출물을 적용하였을 때 부작용 없이 잘 받아들이는 것을 확인하였다. 또한, 통계학적으로 임상적 평가(수의사와 보호자의 QOL)와 혈청 BUN, creatinine 수치, 혈청 인 농도, 단백뇨의 양, 그리고 만성신부전의 IRIS 점수가 루비날치료 6개월 후에 유의성 있게 개선되었다. 이러한 발견은 대황의 추출물은 만성신부적의 임상증상(i.e., azotemia, hypertension, proteinuria, hyperphosphoremia)과 삶의 질(i.e., body condition score, appetite and PD/PU)을 향상시키고, 개에서 만성신부전의 진행을 늦출 수 있다는 것을 보여준다. 그러므로 대황 추출물은 준임상적, 그리고 임상적으로 신장 질환을 치료하고 있는 개에게 좋은 보조제가 될 수 있다. 하지만 본 연구는 작은 규모의 파일럿 연구이므로 이중 맹검법의 대규모 실험을 통해 보다 정확한 실험결과의 재현이 요구된다.

Family history of chronic renal failure is associated with malnutrition in Korean hemodialysis patients

  • Hwang, Ji-Yun;Cho, Ju-Hyun;Lee, Yoon-Jung;Jang, Sang-Pil;Kim, Wha-Young
    • Nutrition Research and Practice
    • /
    • 제3권3호
    • /
    • pp.247-252
    • /
    • 2009
  • The present study was to investigate the nutritional status and factors related to malnutrition in end-stage renal disease (ESRD) patients requiring hemodialysis (HD) in South Korea. Subjects were ESRD outpatients from general hospitals or HD centers in Seoul referred to the dialysis clinic for maintenance HD care. A total of 110 patients (46 men and 64 women; mean ages $58.6{\pm}1.0y$) were eligible for this study. The family history of chronic renal failure (CRF) was considered positive if a patient reported having either a first-degree or second-degree relative with CRF. Malnutrition was defined as a triceps skinfold thickness or mid-ann muscle circumference below the fifth percentile for age and sex and forty-seven of the 110 patients were malnourished. Almost all (94%) patients had anemia (hemoglobin: <13 g/dL for men and <12 g/dL for women). Energy intake was below the recommended intake levels of energy [30-35 kcal/kg ideal body weight (IBW)] and protein (1.2 g/kg IBW) in 60% of patients. The duration of HD was longer in malnourished HD patients (P=0.0095). Malnutrition was more prevalent in women (P=0.0014), those who never smoked (P=0.0007), nondiabetic patients (P=0.0113), and patients with bone diseases (P=0.0427), adequate HD (spKt/$V{\geq}1.2$) (P=0.0178), and those with a family history of CRF (P=0.0255). Multiple logistic regression was used to examine the relationship between malnutrition and potential risk factors. After adjusting for age, sex, and other putative risk factors for malnutrition, the OR for malnutrition was greater in HD patients with a family history of CRF (OR, 3.290; 95% CI, $1.003{sim}10.793$). Active nutrition monitoring is needed to improve the nutritional status of HD patients. A family history of CRF may be an independent risk factor for malnutrition in Korean HD patients. A follow-up study is needed to investigate whether there is a causal relationship between a family history of CRF and malnutrition in Korean ESRD patients.

DNCB로 유도된 NC/Nga 아토피피부염마우스에서 부신피질자극호르몬방출인자 활성에 따른 모발세포의 초기세포사멸 연구 (Acceleration of DNCB-induced Early-apoptosis via Activation of Corticotropin Releasing Factor in the Hair Root of NC/Nga Mice)

  • 박건혁;장은영;김성배;한은영;김용웅
    • 대한화장품학회지
    • /
    • 제43권4호
    • /
    • pp.281-287
    • /
    • 2017
  • 피부에 가해지는 스트레스는 헤어조절 및 사이클에 직 간접적으로 중요한 영향을 미친다고 알려져 있다. 특히, 모근세포는 스트레스에 의한 부신피질관련호르몬과 세포손상 및 사멸과 밀접한 관련이 있다고 보고되고 있지만, 현재까지 실험적으로 입증된 사실은 매우 제한되어 있다. 보고에 의하면, 부신피질자극호르몬방출인자가 증가되면 모근세포의 마이토콘드리아 활성을 저해하여 초기단계의 세포사멸을 가져올 수 있다고 임상학적으로 보고된바가 있다. 특히 아토피 피부염으로 인한 스트레스는 부신피질자극호르몬방출인자와 부신피질관련 호르몬의 양을 증가시키며, 이는 모발의 outer epithelial sheath에 영향을 준다고 알려져 있으며, 이러한 스트레스의 변화는 마이토콘드리아 손상을 초래하여 초기단계세포손상을 준다고 한다. 따라서 본 연구는 아토피피부염스트레스가 피부의 모근세포에 주는 영향에 대하여 연구를 하였는데, 이에 대한 연구는 현재까지 전무한 실정이다. 우리는 NC/Nga 마우스에 2,4-dinitrochlorobenzene (DNCB)로 아토피피부염을 유발 후, 피부 스트레스 생성에 의한 초기단계 세포손상을 스트레스관련 인자, 부신피질자극호르몬방출인자 및 그 관련 인자, annexin V 및 마이토콘드리아 반응을 이용하여 연구하였다. 그 결과, 아토피피부염에 의한 스트레스는 체내의 부신피질 자극호르몬방출인자 및 관련인자의 활성을 증가시킬 뿐 아니라, 모근세포에 영향을 주어 초기단계세포사멸을 초래하는 것으로 나타났다. 이는 아토피피부염관련 헤어손상을 일으킨다는 중요한 연구결과를 보고하는 바이며, 부신피질자극호르몬 조절관련 의약품 및 화장품 등과 같은 보조적 요법이 필요함을 제안한다.

종단 간 심층 신경망을 이용한 한국어 문장 자동 띄어쓰기 (Automatic Word Spacing of the Korean Sentences by Using End-to-End Deep Neural Network)

  • 이현영;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.441-448
    • /
    • 2019
  • 기존의 자동 띄어쓰기 연구는 n-gram 기반의 통계적인 기법을 이용하거나 형태소 분석기를 이용하여 어절 경계면에 공백을 삽입하는 방법으로 띄어쓰기 오류를 수정한다. 본 논문에서는 심층 신경망을 이용한 종단 간(end-to-end) 한국어 문장 자동 띄어쓰기 시스템을 제안한다. 자동 띄어쓰기 문제를 어절 단위가 아닌 음절 단위 태그 분류 문제로 정의하고 음절 unigram 임베딩과 양방향 LSTM Encoder로 문장 음절간의 양방향 의존 관계 정보를 고정된 길이의 문맥 자질 벡터로 연속적인 벡터 공간에 표현한다. 그리고 새로이 표현한 문맥 자질 벡터를 자동 띄어쓰기 태그(B 또는 I)로 분류한 후 B 태그 앞에 공백을 삽입하는 방법으로 한국어 문장의 자동 띄어쓰기를 수행하였다. 자동 띄어쓰기 태그 분류를 위해 전방향 신경망, 신경망 언어 모델, 그리고 선형 체인 CRF의 세 가지 방법의 분류 망에 따라 세 가지 심층 신경망 모델을 구성하고 종단 간 한국어 자동 띄어쓰기 시스템의 성능을 비교하였다. 세 가지 심층 신경망 모델에서 분류 망으로 선형체인 CRF를 이용한 심층 신경망 모델이 더 우수함을 보였다. 학습 및 테스트 말뭉치로는 최근에 구축된 대용량 한국어 원시 말뭉치로 KCC150을 사용하였다.

농식품 가격변동 요인분석을 위한 개체명 인식 (Named Entity Recognition for Analyzing Factors of Agrifood Price Fluctuation)

  • 박찬;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.347-350
    • /
    • 2020
  • 농식품 가격을 안정적으로 제공하기 위해 농식품 가격 변동에 대한 요인 분석이 필요하다. 본 연구는 농식품 가격 변동의 요인 분석을 위해 인과관계 템플릿을 정의하고, 요약을 위한 개체명 인식 방법을 적용한다. 농식품 일일동향 데이터에 대한 평가에서 딥러닝 기반 BiLSTM-CRF 실험 결과 F1-점수 0.93으로 베이스라인 Bi-LSTM 실험 결과 0.75에 비해 높은 성능을 보였다.

  • PDF