통합 검색 | Korea Science

기계학습 기법을 이용한 문장경계인식 (Sentence Boundary Detection Using Machine Learning Techniques)

박수혁;임해창
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2008년도 춘계학술발표대회
- /
- pp.69-72
- /
- 2008
본 논문은 언어의 통계적 특징을 이용하여 범용의 문장경계 인식기를 제안한다. 제안하는 방법은 대량의 코퍼스 내에서 사용되고 있는 문장 경계를 기준으로 음절 및 어절 등의 자질을 이용하여 통계적 특징을 추출하고 다양한 기계학습 기법을 사용하여 문장경계를 인식하고자 하였다. 또한 특정 언어나 도메인에 제한적이지 않고 범용적인 자질만을 사용하려고 노력하였다. 언어의 특성상 문장의 구분이 애매한 경우 또는 잘못 사용 된 구두점 등의 경우에도 적용 가능하도록 다양한 자질을 사용하여 실험하였으며, 한국어와 영문 코퍼스에 대해서 동일한 자질을 적용하여 실험하여 본 논문에서 제시한 자질들이 한국어 및 다른 언어권의 언어에도 적용될 수 있는 범용적인 자질임을 확인할 수 있었다. 한국어 문장경계 인식을 위한 기계학습 및 실험을 위해서 세종계획 코퍼스를 사용하였으며, 성능척도로는 정확률과 재현율을 사용하였으며, 실험결과 제안한 방법으로 99%의 정확률과 99.2%의 재현율을 보였다. 영문의 경우는 Wall Street Journal 코퍼스를 사용하였으며, 동일한 자질을 적용하여 실험한 결과 98.9%의 정확률과 94.6%의 재현율을 보였다.
https://doi.org/10.3745/PKIPS.y2008m05a.69 인용 PDF

제도 & 시행 - 나라장터, "지문인식 전자입찰" 제도 시행

대한설비건설협회
- 월간 기계설비
- /
- 통권237호
- /
- pp.59-61
- /
- 2010
정부의 국가종합전자조달 시스템인 '나라장터'가 $\Delta$동일PC입찰 $\Delta$인증서 양도 대여 $\Delta$입찰 대리인 복수등록 등의 불법 부정 입찰을 줄이기 위해 4월부터 "지문인식 전자입찰"제도를 시행한다. 조달청은 나라장터를 개장하면서 IT강국답게 PC입찰을 결정했고, 인감을 대체할 수 있는 공인인증서를 도입해 운영단계에서 불법 전자입찰을 근절코자 노력을 기울여 왔다. 하지만 온라인상의 부정적인 방법이 날로 지능화되면서 입찰질서를 어지럽히게 되자, 실제 입찰자의 신원을 최적으로 확인할 수 있는 지문인식기술을 도입하게 됐다. 이번에 개발된 지문인식입찰시스템은 지문의 외피가 아닌 진피를 인식하기 때문에 실리콘이나 OHP필름 등을 통한 지문위조를 원천적으로 봉쇄할 수 있게 됐다. 따라서 이런 최신 지문인식 기술을 이용해 온라인상에서 입찰자의 신원을 확인한 후 사전에 등록된 입찰자의 신원과 동일한 경우에만 입찰서 제출이 가능하다. 조달업체의 입찰자(대표 또는 대리인)는 4월 이전에 국내 5개 공인인증기관을 통해 지문보안토큰을 구매하고 주민등록증과 지문보안토큰을 지참해 조달청 고객지원센터를 찾아 신원을 확인한 뒤 지문정보를 등록해야 하며, 지문 정보는 최대 3명까지 보안토큰에 등록돼야 입찰할 수 있게 됐다. "지문인식 전자입찰"제도는 단계적으로 확대돼 7월에는 나라장터뿐 아니라 모든 발주기관에 적용될 방침이다.
PDF

호텔예약을 위한 자동통역 시스템 (An Experimental Speech Translation System for Hotel Reservation)

구명완;김웅인;김재인;도삼주;강용범;박상규;손일현;김우성;장두성
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.105-108
- /
- 1995
한국에 있는 손님이 한국어 만을 사용하여 일본 호텔을 예약할 수 있도록 해 주는 한일간 자동통역 시연 시스템에 관해 기술하였다. 이 시스템은 한국어 음성인식부, 한일 기계번역부, 한국어 음성합성부로 구성되어 있다. 한국어 음성인식부는 기본적으로 HMM을 이용하는 화자독립, 약 300단어급 연속음성인식 시스템으로서 전향 언어 모델로 바이그램 언어 모델, 후향 언어 모델로는 의존 문법을 사용하여 N-BEST 문장을 생성해낸다. 실험결과, 단어 인식률은 top1 문장에 대해 약 94.5%, top5 문장에 대해 약 94.7%의 인식률을 얻었다. 인식 시간은 길이가 다른 여러 문장들에 대해 약 0.1~3초가 걸렸다. 기계번역부에서는 음성인식에서 의존 문법을 사용하여 분석된 파싱 결과를 이용, 직접 번역 방식을 채택하여 일본어를 생성한다. 음성 합성부는 반음소를 합서의 기본단위로 하고, 합성방식으로는 주기 파형 분해 및 재배치 방식으로 하였다. 실험 환경은 2 CPU를 장착한 SPARC 20 workstation 이었으며 실시간 특징 추출을 위해 TMS320C30 DSP 보드 1개를 이용하였다.
PDF

대화형 개인 비서 시스템을 위한 하이브리드 방식의 개체명 및 문장목적 동시 인식기술 (A Simultaneous Recognition Technology of Named Entities and Objects for a Dialogue Based Private Secretary Software)

이창수;고영중
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
- /
- pp.18-23
- /
- 2013
기존 대화시스템과 달리 대화형 개인 비서 시스템은 사용자에게 정보를 제공하기 위해 앱(APP)을 구동하는 방법을 사용한다. 사용자가 앱을 통해 정보를 얻고자 할 때, 사용자가 필요로 하는 정보를 제공해주기 위해서는 사용자의 목적을 정확하게 인식하는 작업이 필요하다. 그 작업 중 중요한 두 요소는 개체명 인식과 문장목적 인식이다. 문장목적 인식이란, 사용자의 문장을 분석해 하나의 앱에 존재하는 여러 정보 중 사용자가 원하는 정보(문장의 목적)가 무엇인지 찾아주는 인식작업이다. 이러한 인식시스템을 구축하는 방법 중 대표적인 방법은 사전규칙방법과 기계학습방법이다. 사전규칙은 사전정보와 규칙을 적용하는 방법으로, 시간이 지남에 따라 새로운 규칙을 추가해야하는 문제가 있으며, 규칙이 일반화되지 않을 경우 오류가 증가하는 문제가 있다. 또 두 인식작업을 파이프라인 방식으로 적용 할 경우, 개체명 인식단계에서의 오류를 가지고 문장목적 인식단계로 넘어가기 때문에 두 단계에 걸친 성능저하와 속도저하를 초래할 수 있다. 이러한 문제점을 해결하기 위해 우리는 통계기반의 기계학습방법인 Conditional Random Fields(CRF)를 사용한다. 또한 사전정보를 CRF와 결합함으로써, 단독으로 수행하는 CRF방식의 성능을 개선시킨다. 개체명과 문장목적인식의 구조를 분석한 결과, 비슷한 자질을 사용할 수 있다고 판단하여, 두 작업을 동시에 수행하는 방법을 제안한다. 실험결과, 사전규칙방법보다 제안한 방법이 문장단위 2.67% 성능개선을 보였다.
PDF

Author-Topic 모델 기반 대본 학습을 통한 비디오 등장 인물 인식 (Recognition of Video Characters by Learning Dialogues Using Author-Topic Models)

임병권;허민오;장병탁
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
- /
- pp.327-330
- /
- 2011
기계학습 기술이 발달함에 따라 기계학습은 제한된 상황에서 벗어나, 실생활과 비슷한 복잡하고 다양한 상황에서의 학습이 중요한 이슈가 되었다. 본고에서는 현실과 비슷한 상황을 도입하기 위하여 드라마를 사용한다. 드라마 내의 등장인물들은 말투, 어조, 관심주제와 같이 다양한 특성을 내재하고 있다. 등장인물들의 다양한 특성 중 관심주제는 대본 안에 글로 드러나 있으므로 기계학습을 통해 등장 인물의 인식에 활용할 수 있다. 최근, 확률그래프모델 분야에서 문서의 주제를 다루는 기법으로 자주 거론되는 토픽 모델 중 하나인 Author-Topic (AT) 모델은 등장인물의 관심주제를 학습하는 데에 적합하다. 본 논문에서는 AT 모델로 대본을 학습하고, 학습된 데이터 분포를 이용하여 장면에 등장하는 인물들을 인식하는 방법을 제시한다. 이 방법의 성능을 측정하기 위해, 미국 TV 드라마 'Friends' 대본 39편을 학습시키고, 장면에 대해 등장인물을 인식하는 실험을 수행하였다. 이 실험을 통해 본고에서 Author-Topic 모델을 이용한 인물 인식 방법이 다수의 인물이 참여한 담화의 인물들을 인식하는데 강점이 있음을 확인할 수 있다.

플라즈마를 활용한 기계기술

송영훈
- 기계저널
- /
- 제53권4호
- /
- pp.33-37
- /
- 2013
산업용 플라즈마를 구성하는 입자의 온도는 기계분야에서 흔히 다루는 온도보다 매우 높은 수천에서 수만 K에 이르는 탓에 플라즈마 기술은 기계분야와는 다소 거리가 있는 것처럼 인식될 수 있다. 그러나 150여 년 전부터 플라즈마 기술은 기계기술과 밀접하게 연계되어 활용되어 왔으며, 향후에는 플라즈마 기술과 기계기술이 더욱 융합되어 새로운 기술이 출현될 것으로 전망되고 있다.
PDF

지능형 서비스 로봇을 위한 인간-로봇 상호작용 기술

유범재
- 기계저널
- /
- 제44권4호
- /
- pp.63-68
- /
- 2004
이 글에서는 로봇에 사용할 수 있는 상호작용 기술들이 아직 초기연구 단계에 머무르고 있어 기존의 얼굴인식과 음성인식 기술동향에 대해 간략하게 소개하고 미국 CMU의 Human-Computer Interaction Institute(HCII)에서 진행 중인 ACT-R(Adaptive Character of Thought)' 프로젝트를 통해 보다 자연스러운 인간-로봇 상호작용의 개념을 소개해한다.
PDF

학습이론을 통한 모양 객체 분석 (Shape Object Analysis using Machine Learning)

최영관;서민형;박장춘
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
- /
- pp.350-352
- /
- 1999
하위레벨 이미지프로세싱(Low-Level Image Processing)과 이미지인식과 해석을 주로하는 상위레벨 이미지프로세싱(High-Level Image Processing)의 접목은 현존하는 기술과 연구소서는 상대적으로 접목이 힘들며 아직까지도 많은 연구가 진행되고 있다. 후자에 더 가까운 접근을 위해서 본 논문에서는 특정 이미지를 인식하는 과정에서 모양-기반 객체(Shaped-Based Object)와 기계학습(Machine Learning) 이론을 바탕으로 두 분야의 연관을 시도하였다. 이미지 내의 객체에 대한 기하학적인 특징을 얻기 위해서 모양-기반의 특징값 추출방법을 제시하고 있으며, 보다 발전된 인식을 위해서 기계학습이론을 적용시키고 있다.
PDF

제로 UI 기술 동향 (Zero UI Technology Trends)

정치윤
- 전자통신동향분석
- /
- 제32권2호
- /
- pp.37-44
- /
- 2017
사용자 인터페이스는 기계와 인간 사이에 상호작용을 할 수 있도록 도와주는 기술로써, 개인용 컴퓨터에서부터 애플의 멀티터치를 사용한 스마트폰까지 스크린 기반의 사용자 인터페이스가 주류를 이루고 있다. 제로 UI(User Interface)는 사용자의 생활 환경 안에서 자연스럽게 사용자의 요구사항을 인지하여 필요한 서비스를 제공함으로써 현재 스크린 기반의 사용자 인터페이스를 최소화하려는 기술이다. 제로 UI는 스마트한 기계들의 상황인지를 통한 판단, 사용자의 음성 인식, 사용자의 자연스러운 제스쳐 인식 등을 통하여 구현될 수 있으며, 본고에서는 음성인식을 통하여 사용자와 친화적으로 상호작용하고 있는 관점과 스마트 기기들이 상황인지를 통하여 자율적으로 판단함으로써 인터랙션을 줄이는 측면에서의 제로 UI의 기술 동향을 소개한다.
PDF

영상인식을 위한 화질의 데이터 분류성 (Data Classification of Visual Quality for Image Recognition)

조재현
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
- /
- pp.279-280
- /
- 2021
패턴 또는 영상을 인식하기 위하여 먼저 기계 학습 모델을 선택하고, 선택된 모델은 여러 단계의 처리 단계 과정으로써, 학습 데이터 구성과 특징 추출 그리고 분류기 등으로 크게 나눌 수 있다. 기존의 학습 모델의 처리 단계 중 학습 데이터 구성은 첫 번째 중요한 단계이다. 본 논문에서는 학습 데이터들의 특징을 분석하여 데이터 분류성의 척도로 사용될 수 있는지를 검토하여 차후 기계 학습 및 딥 러닝의 인식을 높이고자 한다.
PDF

검색결과 1,167건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)