• Title/Summary/Keyword: 정보 수집 및 추출

Search Result 749, Processing Time 0.037 seconds

Analysis of Middle School Students' Difficulties in Science Inquiry Activity in View of Knowledge and Information Processing Competence (지식정보처리역량 관점에서 중학생들의 과학탐구활동 어려움 분석)

  • Son, Mihyun;Jeong, Daehong;Son, Jeongwoo
    • Journal of The Korean Association For Science Education
    • /
    • v.38 no.3
    • /
    • pp.441-449
    • /
    • 2018
  • The knowledge and information processing competence is one of the essential competencies in an information-oriented society which is highly related to science education. The purpose of this study is to investigate middle school students' difficulties in science inquiry activity in view of the knowledge and information processing competence. Collection, processing, and application of information are extracted as common elements of the knowledge and information processing competence through literature search. Data were obtained from eight students of a middle school in Seoul for five months and were analyzed based on constant comparative method to extract students' difficulties. As a result, the element of information collection is observed through science inquiry and the element of information processing is observed in hypothesis setting step, inquiry result analysis step, and inquiry result sharing step. The element of information application is observed in the creation of posters for sharing and inquiry reports. Difficulties in information collection were found in lack of confidence in information gathering, systematic search strategy, and information reliability. Difficulties in information processing appeared in the inexperience of analysis program use, information transformation, and interpretation of linkage information. Difficulties in information application were caused by the lack of effective organization and effective expression of information. In this study, it is meaningful to provide a clue as to how the knowledge and information processing competence can be established in science education.

Competitor Extraction based on Machine Learning Methods (기계학습 기반 경쟁자 자동추출 방법)

  • Lee, Chung-Hee;Kim, Hyun-Jin;Ryu, Pum-Mo;Kim, Hyun-Ki;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

A 2-Step Global Optimization Algorithm for TDOA/FDOA of Communication Signals (통신 신호에서 TDOA/FDOA 정보 추출을 위한 2-단계 전역 최적화 알고리즘)

  • Kim, Dong-Gyu;Park, Jin-Oh;Lee, Moon Seok;Park, Young-Mi;Kim, Hyoung-Nam
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.52 no.4
    • /
    • pp.37-45
    • /
    • 2015
  • In modern electronic warfare systems, a demand on the more accurate estimation method based on TDOA and FDOA has been increased. TDOA/FDOA localization consists of two-stage procedures: the extraction of information from signals and the estimation of emitter location. Various algorithms based on CAF(complex ambiguity function), which is known as a basic method, has been presented in the area of extractions. When we extract TDOA and FDOA information using a conventional method based on the CAF algorithm from communication signals, considerably long integration time is required for the accurate position estimation of an unknown emitter far from sensors more than 300 km. Such long integration time yields huge amount of transmission data from sensors to a central processing unit, resulting in heavy computiational complexity. Therefore, we theoretically analyze the integration time for TDOA/FDOA information using CRLB and propose a two-stage global optimization algorithm which can minimize the transmission time and a computational complexity. The proposed method is compared with the conventional CAF-based algorithms in terms of a computational complexity and the CRLB to verify the estimation performance.

A Study on the Expert System Development for Making Decision of Fire Allocation Using Intelligence of Battlefield (전장정보를 활용한 화력분배 의사결정지원 전문가시스템 개발에 관한 연구)

  • 김화수;노명종;조동래;김응수
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.10a
    • /
    • pp.89-98
    • /
    • 1999
  • 현대전에서는 첩보와 정보의 수집 및 분석 능력과 이를 이용한 효과적인 의사결정을 전쟁의 승패를 좌우할 수 있는 중요한 요소이다. 이를 위하여 첩보와 정보 수집 및 분석을 자동화하기 위한 전장정보분석 자동화에 관한 연구가 국방과학연구소 주관으로 실시되고 있다. 따라서 이와 연계된 의사결정 자동화에 관한 연구가 필요하게 되었다. 본 논문에서는 이러한 요구에 부응할 수 있는 전장정보를 활용한 의사결정의 중요한 한 분야인 화력분야를 자동화하기 위한 전문가시스템 지식베이스의 분석 및 설계에 관한 연구이다. 화력분야 의사결정은 아군의 가용 화력자산을 효과적으로 운용하는 화력분배가 중심이 되며 이 업무는 화력분배에 전문적인 지식을 가진 장교에 의해 실시된다. 이러한 화력분배 자동화를 위하여 본 논문에서는 화력분배와 관련된 현행 업무 관련 지식을 획득 및 분석하고 이를 바탕으로 규칙집합을 추출하였으며 규칙 집합들간의 상호관계, 입력요소, 출력결과 등을 식별하였다. 또한 규칙집합별로 세부적인 규칙을 도출하였고 객체지향기법을 이용한 클래스, 객체, 속성들을 식별하여 에디터를 이용해 지식베이스를 구축할 수 있도록 설계를 완료하였다.

  • PDF

Manufacture of a Small RTE for Real-Time Extraction of Radar Signal (레이더 신호의 실시간 추출을 위한 소형 레이더 목표 추출기 개발)

  • Sung Tae-Kyung;Kim Dong-Seek;Cho Hyung-Rae
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.15 no.9
    • /
    • pp.835-840
    • /
    • 2004
  • Using of small Radar device can not supply the real exercise information of ellipse circumference or CPA, TCPA and the changing of surroundings fur various target information. Therefore, for the above problem, we develop RTE that is able to and of for each information from ARPA Radar which supply analog video signal, trigger bearing and heading pulse from low-cost small Radar device is equiped with general small fishing boat. The small fishing is equipped with small Radar device, so it is able to collect and apply sailing information such as real exercise information and TCPA.

Relation Extraction Model for Noisy Data Handling on Distant Supervision Data based on Reinforcement Learning (원격지도학습데이터의 오류를 처리하는 강화학습기반 관계추출 모델)

  • Yoon, Sooji;Nam, Sangha;Kim, Eun-kyung;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.55-60
    • /
    • 2018
  • 기계학습 기반인 관계추출 모델을 설계할 때 다량의 학습데이터를 빠르게 얻기 위해 원격지도학습 방식으로 데이터를 수집한다. 이러한 데이터는 잘못 분류되어 학습데이터로 사용되기 때문에 모델의 성능에 부정적인 영향을 끼칠 수 있다. 본 논문에서는 이러한 문제를 강화학습 접근법을 사용해 해결하고자 한다. 본 논문에서 제안하는 모델은 오 분류된 데이터로부터 좋은 품질의 데이터를 찾는 문장선택기와 선택된 문장들을 가지고 학습이 되어 관계를 추출하는 관계추출기로 구성된다. 문장선택기는 지도학습데이터 없이 관계추출기로부터 피드백을 받아 학습이 진행된다. 이러한 방식은 기존의 관계추출 모델보다 좋은 성능을 보여주었고 결과적으로 원격지도학습데이터의 단점을 해결한 방법임을 보였다.

  • PDF

Design and Implementation of an Analysis module based on MapReduce for Large-scalable Social Data (대용량 소셜 데이터의 의미 분석을 위한 MapReduce 기반의 분석 모듈 설계 및 구현)

  • Lee, Hyeok-Ju;Kim, Myoung-Jin;Lee, Han-Ku;Yoon, Hyo-Gun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.357-360
    • /
    • 2011
  • 최근 인터넷과 통신기술, 특히 모바일과 관련된 기술의 급속한 발전으로 소셜 커뮤니케이션 수단으로 대표되는 SNS(Social Networking Service)가 중요한 이슈로 부각되어지고 있다. SNS 서비스 제공시 중요하게 고려되어져야 할 사항은 정확하고 의미 있는 데이터를 통해서 사용자가 원하고 관심 있는 분야의 정보를 어떻게 제공할 것인가에 초점이 맞춰져 있어야 한다. 그러나 최근 폭발적으로 증가되어지고 있는 소셜 데이터 때문에 사용자는 의미 분석이 정확하게 이루어지지 않은 신뢰성이 결여된 소셜 커뮤니케이션 서비스를 제공받고 있다. 이러한 소셜데이터 분석의 문제점을 해결하기 위해서 본 논문에서는 소셜 네트워크 서비스에 필요한 데이터를 수집하고, 클라우드 컴퓨팅 환경에서 수집된 대용량 SNS 데이터의 의미를 분석 할 수 있는 MapReduce 기반의 분석 모듈의 구조를 제안하였다. 제안한 모듈은 의미 분석에 필요한 소셜 데이터를 수집하는 수집 기능과 수집된 소셜데이터의 의미 분석을 수행하는 분석 기능을 포함하고 있다. 수집 기능은 SNS에서 생성되는 텍스트 형태의 데이터를 수집하고 MapReduce를 통해서 데이터를 분석하기 쉽게 적절한 크기로 생성된 파일을 분할한다. 수집된 소셜 데이터의 의미 분석은 기존 TF-IDF 방식에 개선된 Weighted-MINMAX 적용한 알고리즘을 통해서 구현하였다. 개선된 알고리즘은 단어의 중요도를 평가하고, 중요도가 높은 단어로 구성된 의미정보 제공 서비스를 지원한다. 시스템의 성능 평가를 위해서 노드별 데이터 처리시간과 추출 키워드의 정확도를 측정하였다.

Reliability Analysis of Privacy Policies Based on Android Static Analysis (안드로이드 정적분석 기반 개인정보 처리방침의 신뢰성 분석)

  • Jung, Yoonkyo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.221-224
    • /
    • 2022
  • 모바일 사용자가 증가함에 따라 모바일 앱에서 사용자가 허용하지 않은 개인정보가 유출되는 프라이버시 문제가 많아졌다. 이를 해결하기 위해 구글은 앱스토어에 등록된 앱이 사용자의 개인정보를 어떻게 활용하는지 개인정보 처리방침에 명시하도록 했다. 하지만 개인정보 처리방침이 실제로 앱의 개인정보 수집 및 처리 과정을 정확히 공개하는지 확인할 수 있는 해결책이 없으며, 사용자는 앱이 개인정보를 어떻게 활용하는지 알기 위해 개인정보 처리방침에 의존해야만 한다. 본 연구에서는 안드로이드 정적 분석으로 앱이 접근할 수 있는 데이터를 확인하고, 개인정보 처리방침의 텍스트를 추출 및 분석한 뒤 결과를 비교하여 개인정보 처리방침의 신뢰성을 분석한다. 실험을 위해 구글 앱스토어에 등록된 13,223개 앱의 패키지 파일과 부가정보를 수집했고 전처리 과정을 거쳐 분석 가능한 앱을 선정했다. 선정한 앱의 모바일 앱 분석 결과와 텍스트 분석 결과를 비교하여 모바일 앱이 개인정보 처리방침에 명시된 것보다 더 많은 개인정보에 접근할 수 있음을 입증한다.

Twitter Sentiment Analysis for the Recent Trend Extracted from the Newspaper Article (신문기사로부터 추출한 최근동향에 대한 트위터 감성분석)

  • Lee, Gyoung Ho;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.10
    • /
    • pp.731-738
    • /
    • 2013
  • We analyze public opinion via a sentiment analysis of tweets collected by using recent topic keywords extracted from newspaper articles. Newspaper articles collected within a certain period of time are clustered by using K-means algorithm and topic keywords for each cluster are extracted by using term frequency. A sentiment analyzer learned by a machine learning method can classify tweets according to their polarity values. We have an assumption that tweets collected by using these topic keywords deal with the same topics as the newspaper articles mentioned if the tweets and the newspapers are generated around the same time. and we tried to verify the validity of this assumption.

Investigating Cyclic Pattern of Mobility through Analysis of Geopositioning Data (이동데이터 시간분석을 통한 이동양태 파악)

  • Hong, Suchan;Song, Ha Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.723-726
    • /
    • 2019
  • 사람은 한 장소를 방문할 때 순환 패턴이 있으며, 이 패턴에 여러 싸이클의 경향이 있다. 요즘은 스마트폰 및 기타 휴대용 장치로 개인 이동성 데이터를 수집하는 것이 가능하다. 이러한 장치는 다양한 위치 데이터를 수집하고 여러가지 방법으로 분석할 수 있게 해준다. 위치 수집기를 기반으로 지구 위치 데이터에서 추출된 사람의 이동성 모델을 수립하고, 위치 클러스터를 방문자의 순환 패턴을 조사할 수 있다. 수년 동안 수집된 개인의 이동성 모델을 토대로 클러스터 재방문 시간을 계산 후 분석하여 그래프로 시각화하였다. 시간 순서의 위치 클러스터와 방문 클러스터에 대한 위치 데이터는 1 분 단위로 측정된다. 전체 데이터 방문 횟수는 15 분마다 정규화하고, 자원 봉사자의 다양한 지리적 위치 데이터 셋에 대해 방문의 순환 패턴은 자기 상관, 자기 공분산 및 재방문 시간으로 살펴볼 수 있다.