• 제목/요약/키워드: 키워드 학습

검색결과 269건 처리시간 0.029초

크라우드 소싱 기반의 지역 교통 이벤트 검출 기법 (Crowdsourcing based Local Traffic Event Detection Scheme)

  • 김윤아;최도진;임종태;김상혁;김종훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.83-93
    • /
    • 2022
  • 운전자가 모바일기기를 사용하여 직접 교통 정보를 제공하는 크라우드 소싱을 활용하여 교통 문제를 해결하려는 연구들이 진행 중이다. 크라우드 소싱을 통해 수집된 데이터를 교통 이벤트 검출에 사용한다면 관련된 데이터를 수집하는 작업이 줄어들어 시간 비용이 낮아지고 정확도는 높아지는 장점이 있다. 본 논문에서는 크라우드 소싱을 활용하여 교통과 관련된 데이터를 수집하고, 이를 통해 교통에 영향을 미치는 이벤트를 검출하는 기법을 제안한다. 제안하는 기법은 대용량 데이터 처리를 위해 기계 학습 알고리즘을 사용하여 수집된 데이터의 이벤트 유형을 판별한다. 또한, 이벤트가 발생된 위치를 추출하기 위하여 수집된 데이터에서 위치를 나타내는 키워드를 추출하고 키워드의 행정구역을 반환한다. 이를 통해 기존 제공되는 위치 정보에서 광범위하게 정의된 위치나 잘못된 위치 정보를 해결할 수 있다. 제안하는 기법의 타당성을 입증하기 위해 다양한 성능 평가를 수행한다.

텍스트 마이닝을 이용한 비대면 소프트웨어 교양과목의 요구사항 분석 (An Analysis for the Student's Needs of non-face-to-face based Software Lecture in General Education using Text Mining)

  • 정화영
    • 한국콘텐츠학회논문지
    • /
    • 제22권3호
    • /
    • pp.105-111
    • /
    • 2022
  • 온라인 수업에 대한 학생들의 니즈 분석은 객관식 설문조사 유형이 주로 수행되어왔다. 그러나 학생들의 정확한 니즈를 분석하기 위해서는 주관식 답변에 의한 비정형 데이터 분석이 요구된다. 빅데이터는 비정형 데이터 분석이 가능하여 다양한 분야에서 활용되고 있다. 본 연구에서는 비대면 온라인 수업방식을 진행되는 교양 소프트웨어 과목에서 학생들이 원하는 과목이나 주제가 무엇인지 조사 및 분석하였다. 실험방법은 학생들에게 주관식 설문조사를 시행하여 얻은 비정형 데이터를 기반으로 빅데이터의 키워드 분석, 연관 분석등을 수행하였다. 이를 통해 학생들이 교양 소프트웨어 과목에서 원하는 키워드가 무엇인지 알 수 있었으며, 이러한 연구 결과는 학생들이 배우고자하는 주제를 파악할 수 있어서 향후 교양 소프트웨어 과목의 기획 및 설계시 중요한 자료가 될 것이다.

문서범주화 성능 향상을 위한 의미기반 자질확장에 관한 연구 (A Semantic-Based Feature Expansion Approach for Improving the Effectiveness of Text Categorization by Using WordNet)

  • 정은경
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.261-278
    • /
    • 2009
  • 기계학습 기반 문서범주화 기법에 있어서 최적의 자질을 구성하는 것이 성능향상에 있어서 중요하다. 본 연구는 학술지 수록 논문의 필수적 구성요소인 저자 제공 키워드와 논문제목을 대상으로 자질확장에 관한 실험을 수행하였다. 자질확장은 기본적으로 선정된 자질에 기반하여 WordNet과 같은 의미기반 사전 도구를 활용하는 것이 일반적이다. 본 연구는 키워드와 논문제목을 대상으로 WordNet 동의어 관계 용어를 활용하여 자질확장을 수행하였으며, 실험 결과 문서범주화 성능이 자질확장을 적용하지 않은 결과와 비교하여 월등히 향상됨을 보여주었다. 이러한 성능향상에 긍정적인 영향을 미치는 요소로 파악된 것은 정제된 자질 기반 및 분류어 기준의 동의어 자질확장이다. 이때 용어의 중의성 해소 적용과 비적용 모두 성능향상에 영향을 미친 것으로 파악되었다. 본 연구의 결과로 키워드와 논문제목을 활용한 분류어 기준 동의어 자질 확장은 문서 범주화 성능향상에 긍정적인 요소라는 것을 제시하였다.

빅데이터 분석을 활용한 사물인터넷 키워드에 관한 조망 (An Insight Study on Keyword of IoT Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.146-147
    • /
    • 2017
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2017년 10월 8일 시점 1개월 기간을 설정하여 "사물인터넷" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 사물인터넷 키워드에 대한 1위 연관 검색어는 기술(995)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

공격키워드 사전 및 TF-IDF를 적용한 침입탐지 정탐률 향상 연구 (A Study on Improving Precision Rate in Security Events Using Cyber Attack Dictionary and TF-IDF)

  • 김종관;김명수
    • 융합보안논문지
    • /
    • 제22권2호
    • /
    • pp.9-19
    • /
    • 2022
  • 최근, 디지털전환의 확대로 사이버공격의 위협에 더욱 더 노출되고 있으며, 각 기관 및 기업은 공격이 유입되는 것을 막기 위해 시그니처 기반의 침입차단시스템을 네트워크 가장 앞단에 운영중에 있다. 그러나, 관련된 ICT시스템에 적절한 서비스를 제공하기 위해 엄격한 차단규칙을 적용할 수 없어 많은 오이벤트가 발생되고, 운영효율이 저하되고 있다. 따라서, 공격탐지 정확도 향상을 위하여 인공지능을 이용한 많은 연구과제가 수행되고 있다. 대부분의 논문은 정해진 연구용 데이터셋을 이용하여 수행하였지만, 실제 네트워크에서는 연구용 학습데이터셋과는 다른 로그를 이용해야만 하기 때문에 실제 시스템에서는 사용사례는 많지 않다. 본 논문에서는 실제 시스템에서 수집한 보안이벤트 로그에 대하여 주요 공격키워드를 분류하고, 주요 키워드별로 가중치를 부과, TF-IDF를 이용하여 유사도 검사를 수행후 실제 공격여부를 판단하는 기법에 대하여 제안하고자 한다.

난이도 자동제어가 구현된 객관식 문항 생성 시스템 (A Sentence Generation System for Multiple Choice Test with Automatic Control of Difficulty Degree)

  • 김용범;김유섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1404-1407
    • /
    • 2007
  • 본 논문에서는 객관식 문항을 난이도에 따라 자동으로 생성하는 방법을 고안하여, 학습자 수준에 적합하도록 다양하고 동적인 형태로 문항 제시를 할 수 있는 시스템을 제안하였다. 이를 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드에 대하여 워드넷의 계층적 특성에 따라 의미가 유사한 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 워드넷에서의 어휘간 유사도 측정 방법을 사용함으로써 생성된 문항의 난이도를 사용자가 원하는 수준으로 조정할 수 있도록 하였다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도를 찾을 수 없는 수준 9 까지 다양하게 제시할 수 있으며, 이를 조절함으로써 문항의 전체 난이도를 조절할 수 있다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 워드넷에서 차지하는 비중까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 보다 다양한 내용과 난이도를 가진 문제 또는 문항을 보다 쉽게 출제하게 함으로써 출제에 소요되는 비용을 줄일 수 있었다.

  • PDF

SaJuTeller: 조건부 생성 모델을 기반으로 한 인공지능 사주 풀이 모델 (SaJuTeller: Conditional Generation Deep-Learning based Fortune Telling Model)

  • 문현석;이정섭;서재형;어수경;박찬준;김우현;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.277-283
    • /
    • 2022
  • 사주 풀이란 주어진 사주에 대해서 그에 맞는 해석 글을 생성해주는 작업을 의미한다. 전통적으로 사주 풀이는 온전한 사람의 영역으로 인식되어왔으나, 우리는 본 연구를 통해 사주 풀이 영역도 인공지능으로 대체할 수 있을 것이라는 가능성을 탐구한다. 본 연구에서 우리는 최근 연구되고 있는 자연어 생성분야의 연구들에서 영감을 받아, 사주 유형과 사주 풀이 내에 포함할 명사 키워드를 기반으로 풀이글을 생성하는 인공지능 모델 SaJuTeller를 설계한다. 특히 이전 문맥을 고려하여 풀이글을 생성하는 모델과 단순 사주 유형 및 명사 키워드를 기반으로 풀이글을 생성하는 두가지 모델을 제안하며, 이들 각각의 성능을 분석함으로써 각 모델의 구체적인 활용 방안을 제안한다. 본 연구는 우리가 아는 한 최초의 인공지능 기반 사주풀이 연구이며, 우리는 이를 통해 사주풀이에 요구되는 전문인력의 노력을 경감시킴과 동시에, 다양한 표현을 가진 사주 풀이 글을 생성할 수 있음을 제안한다.

  • PDF

장면전환검출과 사용자 프로파일을 이용한 비디오 학습 평가 시스템 (Video Evaluation System Using Scene Change Detection and User Profile)

  • 신성윤
    • 정보처리학회논문지D
    • /
    • 제11D권1호
    • /
    • pp.95-104
    • /
    • 2004
  • 본 논문에서는 사용자 프로파일을 기반으로 한 정보 필터링을 사용하여 학생 개인의 특성에 맞는 효율적인 원격 비디오 학습 평가 시스템을 제안한다. 비디오를 이용한 문제 출제를 위하여 위치, 크기, 그리고 컬러 정보를 기반으로 키 프레임을 추출하고 그레이 레벨 히스토그램 차이와 시간 윈도우를 이용하여 문제 출제 추간을 추출한다. 또한 효율적인 평가를 위하여 카테고리 기반 시스템과 키워드 기반 시스템을 합성하여 문제를 출제하도록 한다. 따라서 학생들은 부족한 영역을 보충하고 관심 있는 영역을 유지하면서 학업 성취도를 향상시킬 수 있다.

웹 사용자의 선호도 추출을 위한 지능모델 설계 및 평가 (Design & Evaluation of an Intelligent Model for Extracting the Web User' Preference)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.443-450
    • /
    • 2005
  • 본 논문에서는 웹 사용자의 선호도를 추출하기 위한 지능적 모델을 제안하고 이에 대한 평가결과를 제시한다. 이를 위해 현재 정보검색엔진의 문제점을 분석하고, 선호도 가중치를 학습기에 반영한다. 이것은 키워드에 의한 단어별 빈도수에 의존하지 않고 지능적으로 사용자의 행동유형을 학습하게 함으로써 질의에 대한 결과집합을 사용자의 의도에 맞게 제공하는 메커니즘이다. 다음으로 선호도 유행성에 대한 개념과 고려요소를 제안하며, 선호도 추출 알고리즘과 이에 대한 예를 제시한다. 또한 행동유형 추출을 위한 지능모델을 설계하고 HTML 색인과 선호도 결정 지능학습과정을 제안한다. 마지막으로 선호도를 적용한 후의 문서 랭킹 측정결과를 비교함으로써 본 논문에서 제안한 모델의 타당성을 검증한다.

뉴스 빅데이터를 활용한 코로나 19시기의 원격 교육 동향 분석 (Analysis of remote learning trends in the COVID-19 period using news big data)

  • 이영호;구덕회
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.193-197
    • /
    • 2021
  • COVID-19로 인한 팬데믹 상황은 우리 사회의 사회적, 경제적, 심리적, 그리고 다른 모든 면에서 크고 작은 영향을 미치고 있다. 코로나 19 전파를 막기 위해 우리나라를 포함한 다양한 국가에서는 장기간의 가정 돌봄 및 원격 학습 체제에 들어갔다. 하지만 많은 나라에서 진행된 원격 학습 실험은 대면 교육을 원격 학습으로 대체할 수 있는지에 대한 문제가 제기되었다. 이에 본 연구에서는 원격 수업에 대한 언론 보도 내용을 바탕으로 여론, 사회 인식, 현장의 동향을 분석하였다. 이를 위해 본 연구에서는 원격 수업과 관련된 11개의 신문사 및 4개의 방송사의 기사, 2,600개를 수집하였다. 이 데이터를 바탕으로 키워드 트렌드 분석, 토픽모델링 분석, 감정 분석을 실시하였다.

  • PDF