• 제목/요약/키워드: keyword-based learning

검색결과 131건 처리시간 0.028초

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

Document Classification Methodology Using Autoencoder-based Keywords Embedding

  • Seobin Yoon;Namgyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.35-46
    • /
    • 2023
  • 본 연구에서는 문서 분류기의 정확도를 높이기 위해 문맥 정보와 키워드 정보를 모두 사용하는 이중 접근(Dual Approach) 방법론을 제안한다. 우선 문맥 정보는 다양한 자연어 이해 작업(Task)에서 뛰어난 성능을 나타내고 있는 사전학습언어모델인 Google의 BERT를 사용하여 추출한다. 구체적으로 한국어 말뭉치를 사전학습한 KoBERT를 사용하여 문맥 정보를 CLS 토큰 형태로 추출한다. 다음으로 키워드 정보는 문서별 키워드 집합을 Autoencoder의 잠재 벡터를 통해 하나의 벡터 값으로 생성하여 사용한다. 제안 방법을 국가과학기술정보서비스(NTIS)의 국가 R&D 과제 문서 중 보건 의료에 해당하는 40,130건의 문서에 적용하여 실험을 수행한 결과, 제안 방법이 문서 정보 또는 단어 정보만을 활용하여 문서 분류를 진행하는 기존 방법들에 비해 정확도 측면에서 우수한 성능을 나타냄을 확인하였다.

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.

의학교육에서 기계학습방법 교육: 석면 언론 프레임 연구사례를 중심으로 (Machine Learning Method in Medical Education: Focusing on Research Case of Press Frame on Asbestos)

  • 김준혁;허소윤;강신익;김건일;강동묵
    • 의학교육논단
    • /
    • 제19권3호
    • /
    • pp.158-168
    • /
    • 2017
  • There is a more urgent call for educational methods of machine learning in medical education, and therefore, new approaches of teaching and researching machine learning in medicine are needed. This paper presents a case using machine learning through text analysis. Topic modeling of news articles with the keyword 'asbestos' were examined. Two hypotheses were tested using this method, and the process of machine learning of texts is illustrated through this example. Using an automated text analysis method, all the news articles published from January 1, 1990 to November 15, 2016 in South Korea which included 'asbestos' in the title and the body were collected by web scraping. Differences in topics were analyzed by structured topic modelling (STM) and compared by press companies and periods. More articles were found in liberal media outlets. Differences were found in the number and types of topics in the articles according to the partisanship and period. STM showed that the conservative press views asbestos as a personal problem, while the progressive press views asbestos as a social problem. A divergence in the perspective for emphasizing the issues of asbestos between the conservative press and progressive press was also found. Social perspective influences the main topics of news stories. Thus, the patients' uneasiness and pain are not presented by both sources of media. In addition, topics differ between news media sources based on partisanship, and therefore cause divergence in readers' framing. The method of text analysis and its strengths and weaknesses are explained, and an application for the teaching and researching of machine learning in medical education using the methodology of text analysis is considered. An educational method of machine learning in medical education is urgent for future generations.

암묵적 사용자 프로파일링을 통한 딥러닝기반 지능형 선호 패션 추천 (Deep Learning-based Intelligent Preferred Fashion Recommendation using Implicit User Profiling)

  • 이설화;이찬희;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.25-32
    • /
    • 2018
  • 방대해지고 있는 온라인 패션 시장에서는 소비자도 자신이 원하는 스타일에 대해 키워드 검색으로 원하는 패션 스타일을 일일이 찾기란 쉽지 않은 일이다. 이를 해소해줄 수 있는 것은 소비자의 니즈를 반영한 패션 추천이다. 기존 온라인 쇼핑 사이트는 소비자의 니즈를 파악하고 추천하기 위하여 설문조사 형식으로 소비자의 선호 스타일을 파악하는 것이 대부분이었다. 본 논문에서는 기존 방법의 한계점을 해소하고자 암묵적 프로파일링 방법을 통하여 소비자들의 니즈와 선호하는 스타일에 대해 간편하고 효과적으로 파악할 수 있는 모델을 제안하였다. 또한 이렇게 수집된 데이터로 학습한 딥러닝기반의 지능형 선호 패션 모델을 통하여 이미지 자체에 대한 특성을 반영하도록 학습하는 방법을 제안하였다. 제안한 모델의 정성적 평가를 통하여 의미있는 결과를 얻을 수 있었다.

정보 교육의 교수·학습 방법에 대한 국내 연구 동향 분석 (An analysis on the research trend of teaching and learning methods of informatics education in Korea)

  • 이승진;최현종
    • 컴퓨터교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.15-33
    • /
    • 2017
  • 2015 개정 교육과정은 창의 융합형 인재 양성에 중점을 두고 있으며, 이에 따라 정보 교육의 중요성이 높아지면서 정보 교수 학습 방법에 대한 관심이 높아지고 있다. 이에 본 연구는 정보 교육의 교수 학습 방법의 국내 연구 동향을 분석하고 시사점을 제시하기 위해, 국내 학술지 논문을 대상으로 2000년부터 현재까지의 정보 교육의 교수 학습 방법에 대한 연구 179편을 선정하여 16개의 범주로 분류하여 분석하였다. 연구 분석 결과 문제 중심 학습이 가장 많은 연구가 이루어졌으며 언플러그드 학습, CPS(Creative Problem Solving)모형, 동료교수법 등도 비교적 활발한 연구가 이루어졌다. 또한 정보 교육의 내용 영역으로는 문제 해결과 프로그래밍 영역에 대한 연구가 가장 많이 이루어지고 있었다. 본 연구는 향후 교수 학습 방법에 대한 연구뿐만 아니라 교육 현장에서 교수 학습 방법을 선정하는데 시사점을 줄 수 있을 것으로 기대된다.

키워드 네트워크 분석을 활용한 기후변화 교육 관련 연구동향 분석 (Keyword Network Analysis of Trends in Research on Climate Change Education)

  • 김순식;이상균
    • 대한지구과학교육학회지
    • /
    • 제13권3호
    • /
    • pp.226-237
    • /
    • 2020
  • 본 연구의 목적은 연구제목에서 추출한 키워드를 중심으로 네트워크 분석을 활용하여 기후변화 교육 관련 연구동향을 분석하는 것이다. 이를 위하여 2015년부터 2020년 11월까지 한국연구재단(KCI) 등재(후보)지에 게재된 기후변화 교육 관련 논문의 연도별, 학습지별 동향을 파악하고, 논문에 제시된 키워드에 대한 네트워크 분석을 실시하였다. 분석절차는 분석 대상 선정, 키워드 추출과 정제, 키워드 네트워크 분석 및 시각화의 과정으로 진행되었다. 자료처리는 Textom 분석 프로그램, Ucinet 6.0, NetDraw 프로그램을 활용하였다. 연구결과는 다음과 같다. 첫째, 2011년부터 2020년 사이 총 62편의 기후변화 교육 관련 논문이 게재되었으며, 학술지는 '에너지기후변화 교육'에서 가장 많은 기후변화 교육 관련 논문이 게재된 것으로 나타났다. 둘째, 키워드 '프로그램' 키워드가 가장 높은 빈도를 보였으며, 그 다음으로 '에너지', '분석', '초등학교', '초등학생', '개발', '영향' 등이 높은 빈도를 보였다. 셋째, 연결정도 중심성 분석결과 '프로그램', '초등학생', '초등학교' 지수가 가장 높게 나타났으며, 가장 큰 군집은 '교수·학습 프로그램 개발과 효과'가 형성되었다. 본 연구는 전반적인 기후변화 교육 관련 연구동향을 탐색하고, 향후 연구주제에 대한 방향성을 파악하였다는 데 의의가 있다.

Unicode 기반 다국어 명함인식기 개발 (A Development of Unicode-based Multi-lingual Namecard Recognizer)

  • 장동협;이재홍
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.117-122
    • /
    • 2009
  • 명함을 이용한 전세계적인 고객 관리 시스템을 구축하기 위해 다국어 명함인식기를 개발하였다. 먼저 다양한 언어의 문자인식 및 학습을 위해 Unicode 기반 문자 이미지 DB를 구축하였으며, 다양한 입력 장치를 통해 획득한 명함 영상에 대하여 정확한 데이터를 얻기 위한 다양한 컬러영상 처리 기술이 적용되었다. 다음에 다층 퍼셉트론 신경망, 언어 유형별 개별 문자인식, 각 언어별 명함에 사용된 필드별 키워드 DB를 이용한 후처리를 적용하여 명함 인식률을 향상시켰다.

LEED 인증사례 분석을 통한 교육시설의 녹색건축 인증기준에 관한 연구 (A Study on Green Building Certification Criteria of Educational Facilities based on LEED Certified Cases)

  • 안동준
    • 한국태양에너지학회 논문집
    • /
    • 제34권3호
    • /
    • pp.122-132
    • /
    • 2014
  • Sustainability became the keyword of our society worldwide, and it is undoubtful that buildings are mainly responsible for green house gas emission and energy consumption. Among different project types, educational facility was selected in this study to find out what needs to be addressed in order to provide students better learning environments. Scorecards from 32 LEED certified school projects went through analysis and essential components as design strategies in sustainable educational facilities were extracted based on application rate of each credit in LEED for School(2009). The extracted data were further analyzed in comparison with related components in G-SEED. The results would be used as guidelines for those of who design sustainable education facilities and prepare green building certifications. and it would further foster architect's responsibility towards green society in Korea.

연관법령 검색을 위한 워드 임베딩 기반 Law2Vec 모형 연구 (A Study on the Law2Vec Model for Searching Related Law)

  • 김나리;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권7호
    • /
    • pp.1419-1425
    • /
    • 2017
  • 법률 지식 검색의 궁극적 목적은 법령과 판례를 근거로 최적의 법례정보 획득이라고 할 수 있다. 최근, 대규모 자료에서 효율적으로 검색하여야 하는목적을 달성하기 위하여텍스트 마이닝 연구가 활발히 이루어지고 있다. 대표적인 방법으로 Neural Net 기반 학습방법인 워드 임베딩 알고리즘을 들 수 있다. 본 논문에서는 한국 법령정보를 워드임베딩에 적용하여 연관정보 검색방법을 연구하였다. 우선 판례의 참조법령을 순서대로 추출하여 모형의 입력정보로 활용하였다. 추출한 참조법령들은 중심법령을 기준으로 주변 법령을 학습하고 임베딩하는 Law2Vec 모형을 작성하였다. 이 모형으로 법령에 대하여 학습을 수행하고 법령 간의 관계를 추론하였다. 본 연구의 모형을 평가하기 위하여 연관법령으로 도출된 결과가 키워드와 밀접한 관련이 있는지 정밀도와 재현율을 계산하여 검증하였다. 실험결과, 본 연구의 제안방식이기존의 키워드 검색방법보다 연관된 법령을추론하는데유용함을 알 수 있었다.