• Title/Summary/Keyword: 키워드 선택

Search Result 169, Processing Time 0.036 seconds

Development of geo-coding module prototype on water hazard information (수재해 정보 지오코딩 모듈 프로토타입 개발)

  • BAECK, Seung Hyub;PARK, Gwang-Ha;HWANG, Eui-Ho;CHAE, Hyo-Sok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.476-476
    • /
    • 2017
  • 최근 갑작스런 폭우로 인한 제방 붕괴, 침수 및 지진 등과 같은 재해 발생 시 추가 피해를 방지하고 주민들의 긴급대피를 도운 건 SNS를 통한 현장 정보와 경보 메시지의 지속적인 전파이다. 최근의 SNS는 재난정보에서도 활용할 수 있을 정도로 진화하였다. 국가재난정보 중 수재해 관련 정보를 추출하여 다양한 주제도위에 중첩으로 공간정보를 제공할 수 있는 재난정보 제공을 위한 웹서비스를 개발하고자 하였다. 수재해 정보를 필터링하기 위하여 우선 관련된 키워드 선정이 필요하며, 기본적인 키워드는 하천일람표를 참고하여 6개 권역 및 하천이름을 선정하였다. 또한, 한강 홍수 통제소의 수자원 용어사전과 (사)한국물학술단체연합회에서 발간한 물용어집을 참고하여 수재해 관련 용어들 약 300여개를 추가하였다. 선정된 용어들은 1차적으로 적재된 데이터베이스에서 수재해 정보 관련 필터링을 하는데 사용되며, 비정형 데이터들을 필터링하고 주소 정보 검색 및 추출을 통하여 정형화 하게 된다. 추출된 주소정보에 대하여 개발한 지오코딩 모듈을 적용하여 수재해 항목에 대해 좌표정보를 업데이트 하게 된다. 가뭄, 집중호우, 홍수 등의 수재해 정보별, 또한 일자별 그룹화 및 구조화를 진행하고 해당되는 정보를 공간정보 오픈플랫폼 API를 활용하여 지도상에 가시화할 수 있다. 개발한 지오코딩 모듈을 이용하여 실제 테이블 정보를 구성하여 데이터베이스에 수재해 정보 지오코딩 테이블을 구성하여 테스트 모의하였다. 재난정보 중 홍수, 가뭄에 대한 선택정보와 시간정보를 매개변수로 받는 XML 웹서비스 테스트로 검증을 하였다. 본 연구를 통하여 재난정보 가시화에 있어서 사용자가 조회하고자 하는 유형별, 날짜별 선택이 가능한 공간적 정보를 검색 및 확인할 수 있게 되었다. 개발한 수재해 정보 지오코딩 모듈 프로토 타입은 수재해 정보 플랫폼 융합기술 연구단에서 개발하는 핵심 목표시스템 내 재난정보 제공시스템에 적용 가능하며, 수재해 정보에 대하여 대국민 서비스가 가능할 것으로 사료된다.

  • PDF

Ontology Based Service Discovery using Agents in the Service Block (에이전트를 이용한 온톨로지 기반의 서비스 디스커버리)

  • Shin Jun;Kim Kyu-Il;Hwang Hyun-Sik;Kim Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1411-1414
    • /
    • 2006
  • 유비쿼터스 컴퓨팅환경에서는 다양한 서비스가 존재한다. 사용자들은 수많은 서비스들을 사용하기에 앞서 이들이 어디에 있는지, 어떻게 사용해야 하는지를 알아야 한다. SLP, Jini, 그리고 UPnP 같은 대부분의 현존하는 서비스 디스커버리 (Service Discovery) 기술들은 키워드 매치 방법으로 서비스를 검색한다. 이 같은 방식에서는 사용자가 자신이 이용하고자 하는 서비스에 대한 정확한 명칭을 알고 있어야 서비스를 검색할 수 있다. 그러나 유비쿼터스 환경에서는 매우 다양한 서비스가 존재하고, 사용자들 대부분은 해당 서비스의 전문가가 아니기 때문에 정확한 키워드를 선택하여, 원하는 서비스를 찾는데 어려움이 있다. 시맨틱 웹 분야에서 새롭게 떠오른 온톨로지는 특정 분야에서 사용되는 정보의 구조 혹은 용어에 관한 내용을 사용자들이 공유할 수 있도록 정리해놓은 것이다. 본 논문에서는 이러한 온톨로지의 특성을 이용하여, 사용자에게 이용 가능한 서비스에 대한 정보들을 제공하여 사용자가 다양한 서비스를 쉽게 찾아 쓸 수 있는 방법을 제안하였다. 이 방식은 에이전트간의 온톨로지 교환을 통해서 이루어지며, 서비스 블록(Service Block)이라고 불리는 공간 안에서 수행된다. 또한 서비스 컨트롤러(Service Controller)를 이용하여 서비스를 쉽게 사용할 수 있도록 UI 를 제공한다. 본 시스템을 위하여 JENA2, JADE, Aglet, OWL, 그리고 RDQL 이 사용되었다.

  • PDF

Development of Similar Bibliographic Retrieval System based on Neighboring Words and Keyword Topic Information (인접한 단어와 키워드 주제어 정보에 기반한 유사 문헌 검색 시스템 개발)

  • Kim, Kwang-Young;Kwak, Seung-Jin
    • Journal of Korean Library and Information Science Society
    • /
    • v.40 no.3
    • /
    • pp.367-387
    • /
    • 2009
  • The similar bibliographic retrieval system follows whether it selects a thing of the extracted index term and or not the difference in which the similar document retrieval system There be many in the search result is generated. In this research, the method minimally making the error of the selection of the extracted candidate index term is provided In this research, the word information in which it is adjacent by using candidate index terms extracted from the similar literature and the keyword topic information were used. And by using the related author information and the reranking method of the search result, the similar bibliographic system in which an accuracy is high was developed. In this paper, we conducted experiments for similar bibliographic retrieval system on a collection of Korean journal articles of science and technology arena. The performance of similar bibliographic retrieval system was proved through an experiment and user evaluation.

  • PDF

A Study on Automatic Extraction of Core Sentences from Document using Word Cooccurrence Graph (단어의 공기 관계 그래프를 이용한 문서의 핵심 문장 추출에 관한 연구)

  • Ryu, Je;Han, Kwang-Rok;Sohn, Seok-Won;Rim, Kee-Wook
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3427-3437
    • /
    • 2000
  • In this paper,we propose an method of core sciences extractionusing word cooccrrence graph in order to summarize a document. For automatic extraction of core sentenees, we construct a mean cluster from word cooccurrence graph, and find insistence which corresponds a porposed of author. And then we extract keywords by using relationship between mean cluster and isistence. Finally, core senrences are sclected based on keywords and insitances. The esults are evaluated by comparing with manual extraction, and show that the extraction performance is improved about 10%.

  • PDF

지적재산권 정보에 근거한 산업간 기술연관관계분석 : 부품소재산업 중심의 사례

  • 주시형;이정동;박찬수
    • Proceedings of the Technology Innovation Conference
    • /
    • 2003.06a
    • /
    • pp.57-71
    • /
    • 2003
  • 기술기반사회로의 진화가 빠르게 진행되면서 경제성장에 있어 기술혁신의 중요성이 깊이 인식되어왔다. 그러나 혁신과 관련한 의사결정이 시장에만 맡겨질 경우 종종 시장실패가 일어나기 때문에 다양한 기술 혁신지원정책을 통해 공공이 개입하고 있는 실정이다. 공공의 기술혁신 지원정책이 수립, 시행되는데 있어 가장 중요한 근거는 경제적, 기술적 파급효과이며, 이에 근거할 때 공공차원의 선택과 집중이라는 문제도 합리성을 갖게 된다. 파급효과를 분석하기 위해서는 산업간 기술연관관계분석이 필수적으로 선행되어야 하며, 이와 관련하여 다수의 국내외 연구가 진행되어 왔다. 본 연구에서는 HS코드를 이용하여 산업별로 주 생산물 관련 키워드를 직접 생성하고, 특허 및 실용신안 등 지적재산권에 활용된 키워드 및 분류정보와 일치시킴으로서 지적재산권의 산업간 공유여부를 파악하는 메카니즘을 제안하고자 한다. 제안된 메카니즘을 제조업 세세분류(five-digit level)에 적용함으로서 세세분류산업간 연관관계를 제시하였다. 분석의 결과로서 부품소재산업을 중심으로 살펴볼 때 부품소재산업군과 여타산업군이 기술적으로 분절되어 있음을 확인하였다. 이 결과는 부품소재산업에서의 혁신은 부품소재산업군내에서 (비체화) 기술적 파급효과(disembodied technological spillover)를, 그리고 부품소재산업에서부터 여타 산업으로 (체화) 경제적 파급효과(embodied economic spillover)를 유발한다는 점을 시사하고 있다.

  • PDF

Study of Feature Extraction Algorithm for Harmful word Filtering (유해어 필터링을 위한 자질어 추출 알고리즘에 관한 연구)

  • Jeong Jung-Hoon;Lee Won-Hee;Lee Shin-Won;An Don-Gun;Chung Sung-Jong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.7-9
    • /
    • 2006
  • 유해 정보란 정보의 홍수 속에서 무차별적으로 제공되는 음란, 폭력 등의 내용을 담고 있는 정보를 말한다. 이러한 유해 정보들로부터 청소년 등 사회적으로 보호를 받아야 할 인터넷 이용자들을 보호하기 위한 장치가 필요하다. 현재 다양한 방법이 제안되고 연구되고 있다. 본 연구에서는 유해 문서의 필터링을 기법 중 키워드 필터링에서 사용되는 유해어 사전을 위한 자질어 추출 알고리즘에 대해서 비교/연구하였다. 키워드 필터링에서 자질어는 필터링의 성능에 많은 영향을 미친다. 따라서 필터링의 성능을 높이기 위한 자질어 추출 알고리즘 선택은 매우 중요하다. 이에 본 논문에서는 다양한 알고리즘을 비교 분석하여 정확하고 효율적인 자질어 추출 알고리즘 조합을 찾고자 하였다. 그 결과 CHI/TF-IDF 조합이 높은 성능을 보였으며 92%의 정확도를 얻을 수 있었다.

  • PDF

On the Predictive Model for Emotion Intensity Improving the Efficacy of Emotionally Supportive Chat (챗봇의 효과적 정서적 지지를 위한 한국어 대화 감정 강도 예측 모델 개발)

  • Sae-Lim Jeong;You-Jin Roh;Eun-Seok Oh;A-Yeon Kim;Hye-Jin Hong;Jee Hang Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.656-659
    • /
    • 2023
  • 정서적 지원 대화를 위한 챗봇 개발 시, 사용자의 챗봇에 대한 사용성 및 대화 적절성을 높이기 위해서는 사용자 감정에 적합한 지원 콘텐츠를 제공하는 것이 중요하다. 이를 위해, 본 논문은 사용자 입력 텍스트의 감정 강도 예측 모델을 제안하고, 사용자 발화 맞춤형 정서적 지원 대화에 적용하고자 한다. 먼저 입력된 한국어 문장에서 키워드를 추출한 뒤, 이를 각성도 (arousal)과 긍정부 정도(valence) 공간에 투영하여 키워드가 내포하는 각성도-긍정부정도에 가장 근접한 감정을 예측하였다. 뿐만 아니라, 입력된 전체 문장에 대한 감정 강도를 추가로 예측하여, 핵심 감정 강도 - 문맥상 감정강도를 모두 추출하였다. 이러한 통섭적 감정 강도 지수들은 사용자 감정에 따른 최적 지원 전략 선택 및 최적 대화 콘텐츠 생성에 공헌할 것으로 기대한다.

Improving Diversity of Keyword Search on Graph-structured Data by Controlling Similarity of Content Nodes (콘텐트 노드의 유사성 제어를 통한 그래프 구조 데이터 검색의 다양성 향상)

  • Park, Chang-Sup
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.3
    • /
    • pp.18-30
    • /
    • 2020
  • Recently, as graph-structured data is widely used in various fields such as social networks and semantic Webs, needs for an effective and efficient search on a large amount of graph data have been increasing. Previous keyword-based search methods often find results by considering only the relevance to a given query. However, they are likely to produce semantically similar results by selecting answers which have high query relevance but share the same content nodes. To improve the diversity of search results, we propose a top-k search method that finds a set of subtrees which are not only relevant but also diverse in terms of the content nodes by controlling their similarity. We define a criterion for a set of diverse answer trees and design two kinds of diversified top-k search algorithms which are based on incremental enumeration and A heuristic search, respectively. We also suggest an improvement on the A search algorithm to enhance its performance. We show by experiments using real data sets that the proposed heuristic search method can find relevant answers with diverse content nodes efficiently.

A Study on Research Trend in Field of Busan Port by Social Network Analysis (SNA를 활용한 부산항 연구동향 분석에 관한 연구)

  • Kim, Mi-Jin;Park, Sung-Hoon;Kim, Yu-Na;Lee, Hae-Chan;Yeo, Gi-Tae
    • Journal of Digital Convergence
    • /
    • v.19 no.2
    • /
    • pp.117-133
    • /
    • 2021
  • This study aimed to identify its research trends using social network analysis(SNA). The results of the analysis showed that, for degree centrality, Busan Port(0.223) was the keyword that had the highest centrality, followed by DEA(0.060), AHP(0.056), and container terminal and port competitiveness(0.049). Busan Port(0.245) also had the highest betweenness centrality, followed by DEA(0.048), container terminal(0.044), AHP(0.039), and Busan New Port(0.032). The trend analysis inferred that efficiency analysis(DEA), strategy selection, and competition analysis(AHP) were the keywords with a high centrality for Busan Port to gain a competitive edge with global ports. However, research on the Fourth Industrial Revolution, which is emerging as a key issue, was insufficient. In the future, research using social data, such as mass media and social networks, is necessary.

Attribute extract method based TDIDT for construction of user profile (사용자 프로파일 구축을 위한 TDIDT기반 관심단어 추출기법)

  • 이선미;박영택
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.321-327
    • /
    • 2002
  • 본 논문은 기존의 귀납적 결정 트리 방식에서의 문제점 개선을 통한 사용자 관심 프로파일 구축을 목적으로 한다. 특히 사용자 관심 프로파일의 정확도 향상을 위한 속성 선택에 대한 연구에 초점을 맞추고 있다. 사용자의 관심, 비관심 문서를 대상으로 사용자 관심 키워드를 생성하고 이를 바탕으로 초기 문서들을 재표현한다. 재표현된 문서를 입력 집합으로 하여 기계학습을 진행한다. 본 논문의 의사 결정 트리 생성 알고리즘은 입력 집합을 클래스별로 가장 잘 나누는 속성을 선택하여 노드를 구성하는 면에서는 기존의 알고리즘과 같다. 그러나 기존의 의사 결정 트리 알고리즘에서는 hill-climbing.방식을 사용함으로써 사용자의 관심을 나타내는 중요한 단어가 사용자 관심 프로파일에서 숨겨질 경우가 발생한다. 이를 최소화하기 위해 특징 추출을 통해 선택된 속성을 그대로 학습의 입력 데이터로 사용하는 것이 아니라 입력데이터를 가장 잘 나누는 속성과 그 다음 속성을 대상으로 disjunctive 연산을 통해 새로운 속성을 생성하여 이것을 속성 집합에 포함시키고 이를 학습의 입력 데이터로 이용한다. 이와 같이 disjunctive operator를 이용하여 새로운 속성을 의사 결정 트리 형성 시 이용하면 사용자의 중요한 관심을 포함하는 의미 있는(semantic) 사용자 관심 프로파일 구축이 가능해지고, 사용자 관심 프로파일을 기반으로 사용자가 관심 있는 문서를 제공할 수 있는 개인화 서비스를 제공한다.

  • PDF