• 제목/요약/키워드: Dictionary learning

검색결과 140건 처리시간 0.022초

소셜데이터 분석 및 인공지능 알고리즘 기반 범죄 수사 기법 연구 (Artificial Intelligence Algorithms, Model-Based Social Data Collection and Content Exploration)

  • 안동욱;임춘성
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.23-34
    • /
    • 2019
  • 최근 디지털 플랫폼을 활용한 민생 위협 범죄는 '15년 약 14만여 건, '16년 약 15만여 건 등 사이버범죄 지속 증가 추이이며 전통적인 수사기법을 통한 온라인 범죄 대응에 한계가 있다고 판단되고 있다. 현행 수기 온라인 검색 및 인지 수사 방식만으로는 빠르게 변화하는 민생 위협 범죄에 능동적으로 대처 할 수 없으며, 소셜 미디어 특성상 불특정 다수에게 게시되는 콘텐츠로 이루어 졌다는 점에서 더욱 어려움을 겪고 있다. 본 연구는 민생 침해 범죄가 발생하는 온라인 미디어의 특성을 고려한 콘텐츠 웹 수집 방식 중 사이트 중심의 수집과 Open API를 통한 방식을 제시한다. 또한 불법콘텐츠의 특성상 신속히 게시되고 삭제되며 신조어, 변조어 등이 다양하고 빠르게 생성되기 때문에 수작업 등록을 통한 사전 기반 형태소 분석으로는 빠른 인지가 어려운 상황이다. 이를 해소 하고자 온라인에서 벌어지는 민생 침해 범죄를 게시하는 불법 콘텐츠를 빠르게 인지하고 대응하기 위한 데이터 전처리인 WPM(Word Piece Model)을 통하여 기존의 사전 기반의 형태소 분석에서 토크나이징 방식을 제시한다. 데이터의 분석은 불법 콘텐츠의 수사를 위한 지도학습 기반의 분류 알고리즘 모델을 활용, 투표 기반(Voting) 앙상블 메소드를 통하여 최적의 정확도를 검증하고 있다. 본 연구에서는 민생경제를 침해하는 범죄를 사전에 인지하기 위하여 불법 다단계에 대한 사례를 중심으로 분류 알고리즘 모델을 활용하고, 소셜 데이터의 수집과 콘텐츠 수사에 대하여 효과적으로 대응하기 위한 실증 연구를 제시하고 있다.

  • PDF

텍스트 마이닝과 딥러닝을 활용한 암호화폐 가격 예측 : 한국과 미국시장 비교 (The Prediction of Cryptocurrency on Using Text Mining and Deep Learning Techniques : Comparison of Korean and USA Market)

  • 원종관;홍태호
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.1-17
    • /
    • 2021
  • 본 연구에서는 한국과 미국의 대표적인 거래소인 빗썸과 코인베이스의 비트코인 가격을 ARIMA와 순환 신경망(Recurrent Neural Network)을 이용해 예측하고, 이후 각 국가의 뉴스 기사를 이용해 분리 학습에 기반한 separated RNN 모형을 제안한다. separated RNN 모형은 학습 데이터를 가격의 추세 변화 점을 기준으로 분리해 학습시킨 후, 추세 변화점 별 뉴스 데이터를 활용해 용어 기반 사전을 구축한다. 이후 용어 기반 사전과 평가 데이터 기간의 뉴스 데이터를 이용해 예측할 데이터의 가격 추세 변화 점을 찾아낸 후, 매칭되는 모형을 적용해 예측 결과를 산출한다. 2017년 5월 22일부터 2020년 9월 16일까지의 가격 데이터를 사용해 분석한 결과, 제안된 separated RNN을 이용해 예측한 결과가 한국과 미국의 비트코인 가격 예측 모두에서 순환 신경망(RNN)을 이용해 예측한 결과보다 높은 예측 성과를 보였다. 본 연구는 시계열 예측 기법의 한계를 뉴스 데이터를 이용한 추세 변화 점 탐색을 통해 극복할 수 있고, 성과 향상을 위한 추후 다양한 시계열 예측 기법 및 추세 변화 점 탐색을 위한 다양한 텍스트 마이닝 기법을 적용해볼 필요가 있음을 시사한다.

북한이탈주민의 정보 활용 강화를 위한 교수학습 전략 연구 (A Study on Teaching and Learning Strategies to Enhance Information Utilization of North Korean Defectors)

  • 이선희;변호승
    • 컴퓨터교육학회논문지
    • /
    • 제23권2호
    • /
    • pp.73-82
    • /
    • 2020
  • 본 연구는 북한이탈주민들의 일반적인 현황 및 정보화실태를 분석하고, 정보화교육의 기본방향을 모색하고자 교육 참여자들의 학습 시 나타나는 특성과 요구를 분석하였다. 북한이탈주민들이 학습 시 나타내는 특성은 새로운 기기에 대한 두려움으로 인한 느린 학습, 정보화용어와 외국어의 낯설음으로 인한 학습곤란, 본인이 닥친 상황이 아닌 경우 무관심으로 인한 정보유실 등으로 나타났다. 이와 같은 학습자특성 및 요구를 토대로 본 연구에서는 북한이탈주민 정보화교육 활성화를 위해 단계적 반복에 의한 전략, 남북한 정보화 용어사전을 활용한 전략, 취업중심 및 소통을 위한 전략, 생활밀착형 교육을 위한 전략의 STEP모형을 제안하였다. 북한이탈주민들의 정보화 수준을 높이는 것은 성공적인 남한정착에 도움일 될 것이며, 이는 장차 이루어질 통일한국의 소중한 밑거름이 될 수 있을 것이다.

지구과학 학습을 위한 멀티미디어 학습 자료 데이터베이스 개발 (Development of Multimedia Database for Earth Science Learning)

  • 이원국;김여상;김칠영;김종헌;김희수
    • 한국지구과학회지
    • /
    • 제21권2호
    • /
    • pp.116-127
    • /
    • 2000
  • 본 연구에서는 중학교 및 고등학교의 지구과학 내용에 대한 멀티미디어 학습 프로그램을 개발하였다. 개발된 학습프로그램은 HTML 형식이며 텍스트, 사진, 그림, 동영상 등 다양한 내용물들로 구성되어 있다. 그리고 크게 학습 내용, 용어사전, 생활 과학, 탐구 활동, 영상 자료, 형성 평가 등 6가지 데이터베이스 요소들로 구성되어 있다. 본 연구에서 개발된 멀티미디어 학습 프로그램을 교사와 학생들에게 적용해본 결과 긍정적인 반응을 보였다. 이 프로그램은 현재 공주대학교 과학교육연구소 인터넷 흠페이지에서 무료로 제공하고 있다.

  • PDF

즐겨찾기를 이용한 교육용 정보공유시스템의 설계 및 구현 (Design and Implementation of Educational Information Sharing Systems using Bookmark)

  • 한선관
    • 컴퓨터교육학회논문지
    • /
    • 제7권6호
    • /
    • pp.77-84
    • /
    • 2004
  • 본 연구는 웹브라우저의 즐겨찾기를 이용하여 교육정보를 공유하기 위한 에이전트 시스템의 설계와 구현에 관한 내용이다. 즐겨찾기를 효과적으로 공유하고 검색하기 위하여 DAML+OIL의 형태로 설계하였다. 제안된 시스템 구조는 CS기반의 P2P 방식을 이용하였다. 연구에서 제안된 에이전트는 즐겨찾기된 정보를 기초로 문서의 정확성 판단과 우선순위 기법에 의해 사용자에게 검색과정과 결과를 제시한 수 있다. 또한 에이전트가 Semantic Web환경에서 DAML을 통해 보다 지능적으로 교육정보를 공유하고 검색할 수 있는 시스템을 구현하였다.

  • PDF

비지도 학습을 기반으로 한 한국어 부사격의 의미역 결정 (Unsupervised Semantic Role Labeling for Korean Adverbial Case)

  • 김병수;이용훈;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.112-122
    • /
    • 2007
  • 말뭉치를 이용하여 통계적으로 의미역 결정(semantic role labeling)을 하기 위해서는, 의미역을 태깅하는 작업이 필수적이다. 그러나 한국어의 경우 의미역이 태깅된 대량의 말뭉치를 구하기 힘들며, 이를 직접 구축하기 위해서는 많은 시간과 노력이 필요한 문제점이 있다. 본 논문에서는 비지도 학습의 하나인 self-training 알고리즘을 적용하여, 의미역이 태깅되지 않은 말뭉치로부터 의미역을 결정하는 방법을 제안한다. 이를 위해, 세종 용언 전자사전의 격틀 정보를 이용하여 자동으로 학습 말뭉치를 구축하였으며, 확률 모델을 적용하여 점진적으로 학습하였다. 그 결과, 4개의 부사격 조사에 대해 평균적으로 83.00%의 정확률을 보였다.

Neural-network-based Impulse Noise Removal Using Group-based Weighted Couple Sparse Representation

  • Lee, Yongwoo;Bui, Toan Duc;Shin, Jitae;Oh, Byung Tae
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권8호
    • /
    • pp.3873-3887
    • /
    • 2018
  • In this paper, we propose a novel method to recover images corrupted by impulse noise. The proposed method uses two stages: noise detection and filtering. In the first stage, we use pixel values, rank-ordered logarithmic difference values, and median values to train a neural-network-based impulse noise detector. After training, we apply the network to detect noisy pixels in images. In the next stage, we use group-based weighted couple sparse representation to filter the noisy pixels. During this second stage, conventional methods generally use only clean pixels to recover corrupted pixels, which can yield unsuccessful dictionary learning if the noise density is high and the number of useful clean pixels is inadequate. Therefore, we use reconstructed pixels to balance the deficiency. Experimental results show that the proposed noise detector has better performance than the conventional noise detectors. Also, with the information of noisy pixel location, the proposed impulse-noise removal method performs better than the conventional methods, through the recovered images resulting in better quality.

Destripe Hyperspectral Images with Spectral-spatial Adaptive Unidirectional Variation and Sparse Representation

  • Zhou, Dabiao;Wang, Dejiang;Huo, Lijun;Jia, Ping
    • Journal of the Optical Society of Korea
    • /
    • 제20권6호
    • /
    • pp.752-761
    • /
    • 2016
  • Hyperspectral images are often contaminated with stripe noise, which severely degrades the imaging quality and the precision of the subsequent processing. In this paper, a variational model is proposed by employing spectral-spatial adaptive unidirectional variation and a sparse representation. Unlike traditional methods, we exploit the spectral correction and remove stripes in different bands and different regions adaptively, instead of selecting parameters band by band. The regularization strength adapts to the spectrally varying stripe intensities and the spatially varying texture information. Spectral correlation is exploited via dictionary learning in the sparse representation framework to prevent spectral distortion. Moreover, the minimization problem, which contains two unsmooth and inseparable $l_1$-norm terms, is optimized by the split Bregman approach. Experimental results, on datasets from several imaging systems, demonstrate that the proposed method can remove stripe noise effectively and adaptively, as well as preserve original detail information.

Word2Vec과 LSTM을 활용한 이별 가사 감정 분류 (Parting Lyrics Emotion Classification using Word2Vec and LSTM)

  • 임명진;박원호;신주현
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.90-97
    • /
    • 2020
  • 인터넷과 스마트폰의 발달로 디지털 음원은 쉽게 접근이 가능해졌고 이에 따라 음악 검색 및 추천에 대한 관심이 높아지고 있다. 음악 추천 방법으로는 장르나 감정을 분류하기 위해 음정, 템포, 박자 등의 멜로디를 사용한 연구가 진행되고 있다. 하지만 음악에서 가사는 인간의 감정을 표현하는 수단 중의 하나로 역할 비중이 점점 높아지고 있기 때문에 가사를 기반으로 한 감정 분류 연구가 필요하다. 이에 본 논문에서는 가사를 기반으로 이별 감정을 세분화하기 위해 이별 가사의 감정을 분석한다. 이별 가사에 나타나는 단어 간 유사도를 Word2Vec 학습을 통해 벡터화하여 감정 사전을 구축 한 후 LSTM을 활용하여 가사를 학습시켜 유사한 감정으로 가사를 분류해주는 Word2Vec과 LSTM을 활용한 이별 가사 감정 분류 방법을 제안한다.

디지털 교과서를 이용한 영어 교수-학습 사례연구 (A Case Study of Teaching and Learning English via E-textbook)

  • 박아영;이정민
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.757-766
    • /
    • 2015
  • 최근 첨단기술의 발달과 모바일 인터넷의 사용 증대로 디지털 교과서 개발이 활발해지고 있다. 따라서 본 사례 연구는 2명의 영어 학습자와 교사가 어떻게 디지털 교과서를 통해 학습하고 교수하는지를 관찰과 인터뷰 기법을 통해 탐구했다. 연구 결과 영어 학습자와 교사는 간편하고 다양한 기능과 빠른 인터넷 기반의 디지털 교과서를 통해 교수-학습에 도움을 받은 것으로 나타났다. 그러나 디지털 교과서가 제공하는 많은 양의 정보가 오히려 학습자의 학습을 방해하고, 디지털 교과서를 사용하는데 있어서 교사와 학생 모두 기술적인 어려움을 겼었다고 지적했다. 더 효과적인 디지털 교과서 활용을 위해 영어 교사는 언어적 지식과 더불어 기술적 지식을 학습자에게 전달하고 학습자 주도 학습을 위한 가이드 역할을 수행해야 할 것이다.