Search | Korea Science

Semi-Supervised Answer Type Classification For Question-Answering System (질의 응답 시스템을 위한 반교사 기반의 정답 유형 분류)

Park, Seonyeong;Lee, Donghyeon;Kim, Yonghee;Ryu, Seonghan;Lee, Gary Geunbae
- Annual Conference on Human and Language Technology
- /
- 2013.10a
- /
- pp.45-49
- /
- 2013
기존 연구에서는 질의 응답 시스템에서 정답 유형을 분류하기 위해 패턴 매칭 방식이나 교사 학습(Supervised Learning)을 이용했다. 패턴 매칭 방식은 질의 분석을 통해 수동으로 패턴을 구축해야 한다. 교사 학습에서는 훈련 데이터 전체에 정답 유형이 태깅(Tagging)되어야 하며, 이를 위해서는 사용자의 질의에 정답 유형을 수동으로 태깅하는 작업이 많이 필요하다. 웹을 통해 정답 유형이 태깅되지 않은 대용량의 사용자 질의 말뭉치를 구할 수 있지만, 이 데이터에는 정답 유형이 태깅되어 있지 않다. 따라서, 대용량의 사용자 질의에 비례하여, 정답 유형을 수동으로 태깅하는 작업량이 증가한다. 앞서 언급한 두 가지 방법론에서, 정답 유형 분류를 위해 수작업이 많이 필요하다는 문제점을 해결하고자 본 논문에서는 일부 태깅된 훈련 데이터를 필요로 하는 반교사 학습(Semi-supervised Learning)에 기반한 정답 유형 분류를 제안한다. 이는 정답 유형 분류 작업에 필요한 노동력을 최소화함으로 대용량의 데이터를 통한 효율적 질의 응답 시스템 구축을 가능하게 한다.
PDF

Personalized Service using Local-Storage in HTML5 (HTML5의 Local-Storage를 이용한 개인화 서비스 제공 연구)

Kim, Min-Su;Lee, Gyu-Seok;Choi, Jin-Young
- Proceedings of the Korea Information Processing Society Conference
- /
- 2015.04a
- /
- pp.981-984
- /
- 2015
최근 온라인 마케팅 트렌드는 개인화된 서비스의 제공이다. 인터넷 환경의 대중화와 SNS(Social Networking Service), 모바일 환경의 보급으로 사용자는 쉽게 정보에 노출된다. 이런 환경에서 웹사이트나 애플리케이션, SNS에 대해 사용자의 패턴과 관심사를 분석하여 개인화된 서비스를 제공하게 된다. 데이터 분석은 빅 데이터 환경으로 분석되며 이렇게 분석된 개인화 정보는 사용자와 연관성이 높은 정보를 노출함으로 인해 효율적인 정보의 소비와 더불어 마케팅 효과를 누릴 수 있고, 온라인 서비스나 애플리케이션 제공자에게 사용자도 모르게 제공된 개인의 정보 소비 패턴으로 나타내어진다. 현재 널리 사용되고 있는 서버에 저장된 개인화 데이터는 보안적으로 해킹에 취약할 수 있고, 관리하는 서비스 제공자에게 있어서도 유지보수에 비용이 발생함과 동시에 사용자의 개인정보를 과도하게 수집하게 되는 우려가 나타난다. 개인화 서비스 제공의 단점을 극복하고자 HTML5 Local-Storage 기능을 사용하여 브라우저 환경에서 웹 기반 서비스를 이용하는 사용자의 정보이용 패턴을 저장하여 데이터를 사용자 측면의 저장소에 보관함으로 보다 안전하고 적은 비용으로 개인화 서비스를 제공할 수 있다.
https://doi.org/10.3745/PKIPS.y2015m04a.981 인용 PDF

Flood monitoring and prediction using online unstructured data (비정형데이터를 활용한 홍수 모니터링 및 예측)

Lee, Jeong Ha;Hwang, Seok Hwan
- Proceedings of the Korea Water Resources Association Conference
- /
- 2019.05a
- /
- pp.118-118
- /
- 2019
현재 홍수예보는 정형데이터인 유량 및 수위 등을 활용하여 이뤄지고 있다. 하지만 실제 사람들이 체감하는 홍수에 대한 위험도는 홍수예보 발령과는 달라 홍수예보가 이뤄지지 않은 지역에서 인명사고가 발생하기도 한다. 이는 수위 측정이 이뤄지지 않는 소규모 하천이나 사람들의 유동성이 큰 도심지역에서 빈번하게 발생한다. 이를 보완하기 위해서는 사람들의 체감 정도 및 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 특히 소셜 네트워크 서비스(Social Network Commuinty, SNS)를 사용하는 사람들이 많아지면서 기존에 사용되어 왔던 정형데이터 센서 이외의 데이터를 제공한다. 또한 개개인이 작성하는 글은 실시간으로 활용이 가능하여 인구의 유동성 및 시 공간적 데이터를 얻기에 유용하여 활용성이 매우 높은 비정형데이터이다. 따라서 본 연구에서는 SNS 데이터를 추출하고 이를 분석하여 2018년에 발생했던 강우사상과의 패턴을 비교하여 홍수예보에서의 활용성을 분석하였다. 홍수와 관련한 키워드를 중심으로 시 공간적 정보 및 추출이 가능한 웹 크롤러(Web Crawler) 프로그램을 작성하였으며 이를 토대로 데이터를 수집하였다. 수집한 데이터와 실제 홍수사상을 비교 분석을 한 결과 강우량 및 수위와 해당 지역에 대한 데이터의 양이 유사한 패턴을 보인 것으로 확인되었다. 실시간으로 데이터를 수집하고 이를 분석하여 리드타임을 충분히 확보한다면 홍수예측에 활용 가능할 것이라 생각된다. 본 연구는 한국건설기술연구원 19주요-대4-시드사업인 '커뮤니티 빅데이터 패턴 해석을 통한 수난(水難) 발생 및 규모 예측 기술 개발(20190126-001) '로 수행되었습니다.
PDF

Social Relationship Value Computation based on the Influence of Human Attributes classified by Topics (토픽별 인간 속성의 영향력 기반 소셜 관계 지수 산정)

Kwon, Oh-Sang;Park, Gun-Woo;Lee, Sang-Hoon
- Proceedings of the Korea Information Processing Society Conference
- /
- 2010.04a
- /
- pp.884-887
- /
- 2010
최근 검색엔진의 효율성을 향상시키고 검색결과에 있어서 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 이는 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하는 것을 그 목표로 한다. 특히 본 논문에서는 검색하고자 하는 토픽별 사용자의 인적 속성들이 미치는 영향력을 기반으로 사용자간 소셜 관계 지수(SRV : Social Relationship Value)를 산정하는 방법을 제안한다. 소셜 관계 지수란 인간의 내재적인 특성을 수치로 산정한 것으로, 웹 사용자들에게 있어서는 검색 성향의 유사정도와 직결된다. 따라서 검색하고자 하는 토픽별 개인 성향의 유사정도를 수치로 부여하고 유사성이 높은 사람들의 검색 정보를 이용하면 사용자에 보다 만족된 검색결과를 제공할 수 있다. 본 연구에서는 구글 디렉터리(Google directory)의 정제된 각 토픽별 하위 범주(category)에 대해 선택 결과가 같은 사람들을 대상으로 인적 속성을 분석하고, 그 영향력을 가중치로 적용해 산정된 소셜 관계 지수와 사용자들의 검색 패턴을 비교 하였다. 그 결과 특정인을 기준으로 소셜 관계 지수가 높은 사람들의 검색 패턴이 매우 유사함을 확인 하였다. 이를 통해 토픽별 개인 간 연결 강도가 강할수록, 즉 유사성이 높은 사용자간에는 검색 패턴 또한 유사함을 검증 할 수 있었다.
https://doi.org/10.3745/PKIPS.y2010m04a.884 인용 PDF

Mining Frequent Sequential Patterns over Sequence Data Streams with a Gap-Constraint (순차 데이터 스트림에서 발생 간격 제한 조건을 활용한 빈발 순차 패턴 탐색)

Chang, Joong-Hyuk
- Journal of the Korea Society of Computer and Information
- /
- v.15 no.9
- /
- pp.35-46
- /
- 2010
Sequential pattern mining is one of the essential data mining tasks, and it is widely used to analyze data generated in various application fields such as web-based applications, E-commerce, bioinformatics, and USN environments. Recently data generated in the application fields has been taking the form of continuous data streams rather than finite stored data sets. Considering the changes in the form of data, many researches have been actively performed to efficiently find sequential patterns over data streams. However, conventional researches focus on reducing processing time and memory usage in mining sequential patterns over a target data stream, so that a research on mining more interesting and useful sequential patterns that efficiently reflect the characteristics of the data stream has been attracting no attention. This paper proposes a mining method of sequential patterns over data streams with a gap constraint, which can help to find more interesting sequential patterns over the data streams. First, meanings of the gap for a sequential pattern and gap-constrained sequential patterns are defined, and subsequently a mining method for finding gap-constrained sequential patterns over a data stream is proposed.
https://doi.org/10.9708/jksci.2010.15.9.035 인용 PDF KSCI

TV에서의 Widget 서비스 방향

Im, Jin-Ho
- Proceedings of the Korean Society for Emotion and Sensibility Conference
- /
- 2009.11a
- /
- pp.45.1-45.1
- /
- 2009
방송컨텐츠 중심의 TV에 인터넷이 연결되면서, 사용자의 TV 사용 패턴의 변화를 가져오게 되었다. 다양한 웹상의 컨텐츠를 TV를 통하여 사용할 수 있는 환경이 되면서, 방송이나 멀티미디어를 위한 기존의 Embeded SW와는 다른 형태의 Application의 필요성이 대두되었고, Widget이 하나의 방식으로 활용되고 있다. 본 세션에서는 주요 업체의 Widget 활용 현황 및 TV에 Widget이 적용되었을 때 소비자는 어떤 서비스를 원하는지에 대해 다루어 보고자 한다.
PDF

A Study on Smart Mart System in Ubiquitous Environment (유비쿼터스 스마트 마트 시스템에 관한 연구)

Han, jun-tak
- Proceedings of the Korea Contents Association Conference
- /
- 2011.05a
- /
- pp.485-486
- /
- 2011
본 논문에서는 물품을 체계적이며, 빠르게 구입하고 쇼핑 시간을 단축할 수 있도록 웹페이지를 통해 미리 쇼핑 계획을 세울 수 있는 스마트 폰 환경에서 내비게이션과 장바구니 기능을 제공한다. 또한 RFID를 이용하여 빠른 시간 내에 자가 계산을 할 수 있도록 한다. 제안하는 시스템을 통해 소비자는 효율적인 쇼핑을 할 수 있고 사업자는 자가 계산대로 인해 인건비를 줄이고 소비자의 소비 패턴을 쉽게 수집 할 수 있어 광고 등을 통한 매출을 더욱 증대 시킬 수 있다.
PDF

A Contents-Based Image Classification Using Neural Network (신경망을 이용한 내용 기반 이미지 분류)

이재원;김상균
- Proceedings of the Korea Multimedia Society Conference
- /
- 2001.06a
- /
- pp.177-180
- /
- 2001
본 논문에서는 신경망을 이용한 내용 기반 이미지 분류 방법을 제안한다. 분류 대상이미지는 인터넷상의 다양한 이미지들 중 오브젝트 이미지이대 웹 에이전트를 통하여 획득하고 정규화 과정을 거친다. 획득한 이미지를 분류하기 위한 특징은 웨이블릿 변란 후 추출된 질감 특징이다. 추출된 질감 특징을 이용하여 학습패턴을 생성하고 신경망을 학습한다. 그리고 구성된 신경망 분류기로 이미지를 분류한다. 본 연구에서는 다양한 질감 특징들 중에서 대비(contrast), 에너지(energy), 엔트로피(entropy)를 이용하여 특징을 추출한다. 실험에 사용한 데이터는 30종류에 대하여 각각 10개씩, 300개의 이미지들을 학습 데이터, 테스트 데이터로 사용하여 구성된 분류기의 인식률을 실험하였다.
PDF

Subtopic Mining from the View of Dependency Structure (의존 구문 구조 관점으로 본 서브토픽 마이닝)

Kim, Se-Jong;Lee, Jong-Hyeok
- Proceedings of the Korean Information Science Society Conference
- /
- 2012.06b
- /
- pp.294-296
- /
- 2012
본 논문은 일본어 웹 문서 말뭉치로부터 의존 구문 구조 관점으로 바라본 단어들의 동시발생(co-occurrence) 정보를 사용하여 서브토픽 마이닝(subtopic mining)을 수행하는 방법론을 제안한다. 우리는 의존 구문 구조를 반영하는 간단한 패턴들을 사용하여 서브토픽들을 추출 및 생성하고, 제안한 수식을 바탕으로 순위화한다. 본 방법론은 기존의 주요 상용 검색 서비스에서 제공하는 연관 검색어 및 추천 검색어를 사용한 방법론보다 좋은 성능을 보였다.

Trainable Interface Agents for Informal ion Extract ion (정보추출을 위한 학습 가능한 인터페이스 에이전트)

김용기;양재영;최중민
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10b
- /
- pp.61-63
- /
- 2001
본 논문의 목적은 기계 학습 방법을 이용하여 정보 추출 규칙의 패턴을 학습할 수 있는 인터페이스 에이전트의 개발에 있다. 인터페이스 에이전트는 사용자와 상호작용이 가능한 지능형 에이전트이다. 사용자는 인터페이스 에이전트와 상호작용을 하게 되며 에이전트는 이 상호 작용에서 사용자가 원하는 정보 추출 규칙을 학습하게 된다. 사용자는 웹 문서에서 원하는 정보의 위치를 지정하여 데이터를 인터페이스 에이전트에게 학습시킨다. 인터페이스 에이전트는 학습된 추출 규칙으로부터 사용자가 원하는 정보를 추출한다.
PDF

Search Result 552, Processing Time 0.028 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)