Search | Korea Science

Korean Morphological Analyzer and Part-Of-Speech Tagger Based on CYK Algorithm Using Syllable Information (음절단위 CYK 알고리즘에 기반한 형태소 분석기 및 품사태거)

Kwon, Oh-Woog;Chung, Yu-Jin;Kim, Mi-Young;Ryu, Dong-Won;Lee, Moon-Ki;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 1999.10d
- /
- pp.76-86
- /
- 1999
본 논문에서는 포항공과대학교 지식 및 언어공학연구실에서 개발한 한국어 형태소 분석기 및 품사 태거에 대하여 설명한다. 먼저, 음운 축약 현상이 많은 한국어에 적합한 음절단위 CYK 알고리즘을 제안한다. 그리고, 복합명사 및 복합동사에 대한 처리와 실제 문서에서 빈번히 발생하는 띄어쓰기 오류 처리에 대한 방법론을 설명하고 미등록어에 대한 처리 방안을 제시한다. 품사 태거에서 사용된 방법론과 태그 집합간 매핑, 그리고 명사 추출기에 대해 기술한 후 마지막으로 MATEC'99를 위한 준비과정에서 발생한 표준안과 우리 시스템 사이의 차이점을 나열 및 분석하고 간단히 MATEC'99를 통해 얻은 실험 결과와 평가를 하고자 한다.
PDF

Macroscopic and Microscopic Traffic Simulation Using the Discrete Event system Formalism (이산 사건 형식론을 이용한 거시적 및 미시적 교통류 시뮬레이션)

이종근
- Proceedings of the Korea Society for Simulation Conference
- /
- 1999.04a
- /
- pp.110-114
- /
- 1999
본 연구는 Zeigler가 제안한 이산 사건 시스템 형식론(DEVS: Discrete Event System Specification)을 이용한 거시적 및 미시적 교통류 시뮬레이션 방법론의 개발을 주 목적으로 한다. 도로 교통망의 모델링 방법은 미시적(microscopic)방법과 거시적(macroscopic)방법으로 분류된다. 이러한 모델링 방법들은 그 목적에 따라 각기 표현되어 제각기 사용되어 왔으나, 시스템 이론적으로 이들은 독립적 모델이 아니며 오히려 이들은 서로 동질적 추상화 관계에 있어서, 통합 모델링 환경의 구축시 미시적 모델들로부터 추상화에 의한 거시적 모델의 자동생성 등 설계상의 효율뿐 아니라 모델간의 일관성을 통한 모델 유효성을 보장할 수 있는 장점이 제공될 수 있다. 따라서, 본 논문에서는 서로 다른 표현 방법(즉, 이산시간 형식론과 이산사건 형식론)간의 통합 표현을 기반으로 양자간의 추상화 관계를 도출하고, 이를 이용한 모델 추상화를 통해 거시적 및 미시적 교통류 시뮬레이션 방법론을 제안한다. 시스템 이론적 접근을 토대로 접근한 통합 교통류 시뮬레이션 환경은 미국 Berkeley 대학 교통 연구소에서 개발한 SHIFT 등과 같은 최첨단 교통류 시뮬레이션 도구에 비하여 SES/MB를 기반을 시스템 이론적이며 소프트웨어공학적인 접근을 통하여, 1) 기존 제어 방식의 검증 및 신뢰도 분석, 2) 각종 사건, 사고의 시간별 파급효과 분석, 3) 도로건설 계획안에 대한 타당성 검토, 4) 운전자 및 관리자를 위한 예측된 교통정보 등을 제공할 수 있을 것으로 기대된다.
PDF

Study on the Differences in Yield Network Structures (수익률 측정 통계량에 따른 네트워크 형태의 차이에 관한 연구)

Insu Choi;Woo Chang Kim
- Proceedings of the Korea Information Processing Society Conference
- /
- 2024.05a
- /
- pp.522-523
- /
- 2024
상호의존성을 검증하기 위해 통계적 측정치를 사용한 심층 분석을 통해 섹터 기반 상장지수펀드를 중심으로 금융 네트워크의 불일치를 분석한다. 최소 스패닝 트리, p 값 기반 네트워크와 같은 방법론을 채택하여 가격 기반 불일치를 조사하여 금융 데이터 내의 기본 네트워크 구조를 파악합니다. 우리의 주요 기여는 다양한 측정치와 네트워크 분석을 사용하여 금융 시장에 대한 다양한 통찰력을 제공하는 방법을 보여주는 것이다.
https://doi.org/10.3745/PKIPS.y2024m05a.522 인용 PDF

Embedded clause extraction and restoration for the performance enhancement in Korean-Vietnamese statistical machine translation (한베 통계기계번역의 성능 향상을 위한 내포문 추출 및 복원 기법)

Cho, Seung-Woo;Kim, Young-Gil;Kwon, Hong-Seok;Lee, Eui-Hyun;Lee, Won-Ki;Cho, Hyung-Mi;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 2016.10a
- /
- pp.280-284
- /
- 2016
본 논문에서는 기호로 둘러싸인 내포문이 포함된 문장의 번역 성능을 높이는 방법을 제안한다. 입력 문장에서 내포문을 추출하여 여러 문장으로 나타내고, 각각의 문장들을 번역한다. 그리고 번역된 문장들을 복원정보를 활용하여 최종 번역 문장을 생성한다. 이러한 방법론은 입력 문장의 길이를 줄여주며, 그로 인하여 문장 구조가 단순해져 번역 품질이 향상된다. 본 논문에서는 한국어-베트남어 통계 기반 번역기에 대하여 제안한 방법론을 적용하고 실험하였다. 그 결과 BLEU 점수가 약 1.5 향상된 것을 확인할 수 있었다.
PDF

A Methodology on expression of structured HANGUL for Mini_Specification. (미니 명세서의 구조적 한글 표현에 관한 방법론)

Cho, Sung-Hee
- Annual Conference on Human and Language Technology
- /
- 1991.10a
- /
- pp.257-266
- /
- 1991
본 논문은 효율적인 소프트웨어 개발을 위한 수단으로 구조적 분석 기법을 사용하는데 구조적 분석 도구중의 하나인 미니 명세서률 한글화하고 나아가서는 전반적 자동화 연구에 있어 비 전문 사용자가 쉽게 접할수 있도록 한글화를 실현하고자 하는데 그 목적을 둔다.
PDF

Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets (신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화)

Park, Yewon;Yang, Dongil;Kim, Soofeel;Lee, Kangwook
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.18-22
- /
- 2019
FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.
PDF

Development of an Approximate Cost Estimating Framework for River Facility Construction at Planning Stage (하천시설물 공사의 기획단계 개략공사비 산정체계 개발)

Shin, Jung Min;Woo, Sungkwon;Lee, Si Wook;Kim, Ok Ki
- KSCE Journal of Civil and Environmental Engineering Research
- /
- v.28 no.3D
- /
- pp.371-381
- /
- 2008
The systematic methodology for estimating construction cost approximately at planning and pre-design phase of a river facility construction project has not yet been established because of its unique characteristics including its relatively small project size in terms of cost. This research suggests a 4-level cost information structure and identifies critical factors affecting construction cost as a result of thorough analysis of accumulated historical cost data of river facility construction projects. Also, this research presents the framework of the approximate cost estimating methodology for river facility construction project a planning stage.
https://doi.org/10.12652/Ksce.2008.28.3D.371 인용 PDF

Software Defect Prediction Based on SAINT (SAINT 기반의 소프트웨어 결함 예측)

Sriman Mohapatra;Eunjeong Ju;Jeonghwa Lee;Duksan Ryu
- The Transactions of the Korea Information Processing Society
- /
- v.13 no.5
- /
- pp.236-242
- /
- 2024
Software Defect Prediction (SDP) enhances the efficiency of software development by proactively identifying modules likely to contain errors. A major challenge in SDP is improving prediction performance. Recent research has applied deep learning techniques to the field of SDP, with the SAINT model particularly gaining attention for its outstanding performance in analyzing structured data. This study compares the SAINT model with other leading models (XGBoost, Random Forest, CatBoost) and investigates the latest deep learning techniques applicable to SDP. SAINT consistently demonstrated superior performance, proving effective in improving defect prediction accuracy. These findings highlight the potential of the SAINT model to advance defect prediction methodologies in practical software development scenarios, and were achieved through a rigorous methodology including cross-validation, feature scaling, and comparative analysis.
https://doi.org/10.3745/TKIPS.2024.13.5.236 인용 PDF

An Internet Ethics Training Method by exploiting Smartphone (스마트폰을 활용한 인터넷윤리 교육 방법)

Kim, In-Hwan;Bae, Ji-Hye;Lee, Hyun;Park, Jung-Ho
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.04a
- /
- pp.1359-1361
- /
- 2012
현실세계의 기본이 되는 사회규범 및 윤리교육이 있듯이 인터넷 기반의 사이버 세계에서도 윤리교육을 필요로 하는데, 이에 대한 교육 및 대처가 많이 부족하다. 특히, 국내외의 경우, 반복적인 학습이나 다양한 매체를 통해 일괄적으로 제시하는 방법을 통해 인터넷윤리교육을 진행하고 있으나, 체계적인 방법론을 제시하고 있지 못하고 있다. 따라서 본 논문에서는 스마트폰 기반의 스토리텔링 기법을 통한 새로운 인터넷윤리 교육방법을 제시하고자 한다. 특히, 기존 방법과 달리 새로운 인증프로그램, 수준별 맞춤 교육기법, 양방향 커뮤니케이션 기법, 유해정보 인증 방법 등 M-learning 기반으로 적용하여 효율적이고 구체적인 교육방법을 제시하였다.
https://doi.org/10.3745/PKIPS.y2012m04a.1359 인용 PDF

Cross-document Relation Extraction using Bridging Context Identification (중간 문맥 식별 및 검색을 활용한 문서간 관계 추출)

Junyoung Son;Jinsung Kim;Jungwoo Lim;Yoonna Jang;Aram So;Heuiseok Lim
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.654-658
- /
- 2023
관계 추출은 질의응답이나 대화 시스템의 기반이 되는 지식을 구추하기 위한 작업으로, 정보 추출의 기초가 되는 기술이기도 하다. 최근 실세계 지식의 희소한 형태를 구현한 문서간 관계 추출 데이터셋이 제안되어, 여러 문서를 통해 분산되어 언급된 두 개체 사이의 관계 추론을 수행 및 평가할 수 있게 되었다. 이 작업에서 추론의 대상이 되는 개체쌍은 한 문서 안에 동시에 언급되지 않기 때문에 여러 문서에 언급된 중간 개체를 통하여 직/간접적으로 추론해야 하나, 원시 텍스트에서 이러한 정보를 수집하는 작업은 쉽지 않다. 따라서, 본 연구에서는 개체의 동시발생빈도에 기반하여 중간 개체의 중요도를 정량화하고, 이 중요도에 기반화여 중요한 문맥을 식별하는 방법론을 제안한다. 제안하는 방법론은 기존의 두 문서로 구성된 추론 경로를 식별된 중간 개체를 활용하여 확장하여, 관계 추론 모델의 수정 없이 추가된 문맥만을 활용하여 문서간 관계 추출 시스템의 성능을 개선할 수 있었다.
PDF

Search Result 798, Processing Time 0.026 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)