• 제목/요약/키워드: 텍스트수준

검색결과 267건 처리시간 0.029초

시맨틱 검색 시스템의 개념적 모형화와 그 구현에 대한 연구 (A Study on the Conceptual Modeling and Implementation of a Semantic Search System)

  • 한동일;권혁인;정학진
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.67-84
    • /
    • 2008
  • 본 논문은 시맨틱 검색 시스템에 관한 포괄적인 개념적 모델 제안과 실질적인 구현 사례를 제시한다. 제안된 시맨틱 검색 시스템은 개념적으로 3계층의 아키텍처 지식획득 계층, 지식표현 계층, 지식이용 계층으로 구성하여 설계 및 구현되었다. 지식획득(Knowledge acquisition) 계층은 다양한 소스(Source)의 콘텐츠(텍스트, 이미지, 멀티미디어등)로부터 시맨틱 메타데이터를 생성 및 저장하는 영역이다. 지식표현(Knowledge Representation) 계층은 온톨로지의 스키마와 인스턴스를 구축하고, 이러한 온톨로지 기반 질의 확장 등을 통해 시맨틱 검색을 처리하는 영역이다. 마지막으로 지식이용(Knowledge Utilization) 계층은 검색 이용자가 시맨틱 웹 언어 또는 온톨로지에 대한 지식이 없더라도 직관적으로 검색 질의(Query)를 입력하고 검색 결과를 확인할 수 있도록 구성하였다. 향후 제시된 시맨틱 검색 시스템은 기존 연구 수준의 시맨틱 검색 시스템을 상용화 수준으로 향상시킬 수 있는 계기가 될 것으로 기대된다.

  • PDF

텍스트마이닝 분석을 활용한 SNS 데이터 기반의 정보교육의 동향 분석 연구 (A Trend Analysis of Computer Education based on SNS Data through Data Mining Analysis)

  • 김갑수;전석주;구덕회;신승기
    • 정보교육학회논문지
    • /
    • 제25권2호
    • /
    • pp.289-300
    • /
    • 2021
  • 본 연구에서는 SNS 데이터를 수집하고 토픽모델링기법으로 분석하여 SW교육과 AI교육에 대한 키워드와 토픽을 도출하여 시사점을 살펴보고자 하였다. SNS 데이터 분석을 통해 SW교육에 대해서 인재양성 및 전국민 SW교육에 대한 내용과 학교현장에서의 수업설계 및 교수학습방법에 대한 내용이 관심이 높음을 살펴볼 수 있었다. 초등학교에서부터 별도의 교과를 통해 SW교육이 실시되어야 하며, 이는 AI교육에 대한 분석결과에서 정보교과를 토대로 위계를 고려한 교과편성 및 운영이 필요하다는 의견과 일치되었다. AI교육은 새롭게 도입되는 영역으로 현장학교의 지원이 필요하다는 의견이 있었으며, AI인재양성을 위해 대학교육에서도 추진되어야 함을 살펴볼 수 있었다. SNS 데이터 분석을 통해 살펴볼 수 있는 SW교육과 AI교육에 대한 동향은 결국 정보교육의 내실있는 운영과 교육과정 편성으로 귀결된다고 할 수 있으며 이는 국가수준교육과정 편성에 대한 시사점을 내포한다고 할 수 있다.

관련 연구 자동 생성을 위한 LLM의 활용 및 정제 기법 제안 (Proposal for the Utilization and Refinement Techniques of LLMs for Automated Research Generation)

  • 최승민;정유철
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.275-287
    • /
    • 2024
  • 과거부터 꾸준히 지식 그래프(Knowledge Graph)와 언어 모델(LM, Language Model)의 통합에 대한 많은 연구가 다뤄지고 있다. 그 중, 지식 그래프의 구조화된 지식을 이용해 자동 텍스트 생성을 다루는 연구는 그리 활성화되지 않았다. 본 연구에서는 기존 논문들과 비슷한 수준의 특정 도메인 관련 연구 항목(Related Work)을 자동 생성하기 위한 방법론, 즉, '1) 최적의 Prompt 선정, 2) 4단계 정제기법을 통해 Triple 추출, 3) 지식 그래프 구축, 4) 관련 연구 자동 생성'을 제안한다. 제안된 방법론은 대규모 언어 모델(LLM) 중, GPT-4를 활용하고, 4단계 정제 기법을 적용하여 관련 연구를 자동으로 생성하도록 설계했다. 그렇게 설계된 모델은 Triple 추출에서 #Supp, #Cont, Fluency에서 17.3, 14.1, 4.2의 성능과 GPT-4 자동 평가 기준, 100점 기준 정제 전, 88.5점에서 정제 후, 96.5점으로 기존 논문과 비슷한 수준의 유의미한 관련 연구 자동 생성 능력을 보였다.

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

아파치 스파크에서 모바일 빅 데이터에 대한 다계층 인공신경망 기반 분산 딥러닝 구현 및 최적화 (Implementation and Optimization of Distributed Deep learning based on Multi Layer Neural Network for Mobile Big Data at Apache Spark)

  • 명노영;안범진;유헌창
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.201-204
    • /
    • 2017
  • 빅 데이터의 시대가 도래하면서 이전보다 데이터로부터 유의미한 정보를 추출하는 것에 대한 연구가 활발하게 진행되고 있다. 딥러닝은 텍스트, 이미지, 동영상 등 다양한 데이터에 대한 학습을 가능하게 할 뿐만 아니라 높은 학습 정확도를 보임으로써 차세대 머선러닝 기술로 각광 받고 있다. 그러나 딥러닝은 일반적으로 학습해야하는 데이터가 많을 뿐만 아니라 학습에 요구되는 시간이 매우 길다. 또한 데이터의 전처리 수준과 학습 모델 튜닝에 의해 학습정확도가 크게 영향을 받기 때문에 활용이 어렵다. 딥러닝에서 학습에 요구되는 데이터의 양과 연산량이 많아지면서 분산 처리 프레임워크 기반 분산 학습을 통해 학습 정확도는 유지하면서 학습시간을 단축시키는 사례가 많아지고 있다. 본 연구에서는 범용 분산 처리 프레임워크인 아파치 스파크에서 데이터 병렬화 기반 분산 학습 모델을 활용하여 모바일 빅 데이터 분석을 위한 딥러닝을 구현한다. 딥러닝을 구현할 때 분산학습을 통해 학습 속도를 높이면서도 학습 정확도를 높이기 위한 모델 튜닝 방법을 연구한다. 또한 스파크의 분산 병렬처리 효율을 최대한 끌어올리기 위해 파티션 병렬 최적화 기법을 적용하여 딥러닝의 학습속도를 향상시킨다.

  • PDF

한글 감정단어의 의미적 관계와 범주 분석에 관한 연구 (A Study on the Analysis of Semantic Relation and Category of the Korean Emotion Words)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권2호
    • /
    • pp.51-70
    • /
    • 2016
  • 이 연구의 목적은 한글로 된 주요감정단어들의 리스트를 대상으로 의미적 관계의 네트워크와 극성과 각성의 범주를 분석하는데 있다. 분석결과는 다음과 같다. 첫째, 감정단어 네트워크에서 각 감정단어들은 의미적으로 연결되어 있었다. 이것은 의미적 유사성에 따라 감정단어들의 유형을 구분하는 것을 어렵게 하는 특징이다. 대신에 의미적 관계의 감정단어 네트워크에서 중심적인 역할을 수행하는 감정단어들을 확인할 수 있었다. 둘째, 극성과 각성의 차원을 혼합한 범주에서, 많은 감정단어들은 부정적인 극성과 높은 각성의 단어들 집단과 부정적인 극성과 중간수준 각성의 단어들 집단으로 분류되었다. 이러한 한글감정단어의 특성들은 도서관이나 문헌정보에 나타나는 각종 텍스트 데이터의 감정분석에 유용하게 활용될 것이다.

문제 해결 방식의 아홉 단계 '쓰기 전' 과정 (A 9-Step Prewriting Process As the Problem Solving Approach)

  • 권성규
    • 공학교육연구
    • /
    • 제15권3호
    • /
    • pp.22-39
    • /
    • 2012
  • 이 논문에서는 과정 중심의 글쓰기 방법을 문제 해결 방식과 설계 과정의 특성에 비추어 소개하고, 글쓰기 과정의 일부인 '쓰기 전' 과정을 아홉 단계로 구분하고 그 단계들을 적용하는데 필요한 용어들을 정의한다. 그 단계들의 특성을 글의 주제를 정하는 관점에서 살피고, 그 단계들을 적용하는데 필요한 지식과 전략을 종합하고, 아홉 단계의 과정을 문제 해결 및 설계 과정과 비교하며, '쓰기 전' 단계들의 반복 학습 및 과정 중심의 글쓰기 교육에서 텍스트 수준 지식의 학습 방안에 대해서 토의한다. 아홉 단계에 의한 '쓰기 전' 과정이, 공대생들의 글쓰기 배우기와 공대 교수들의 글쓰기 가르치기, 둘 다에 도움이 될 것으로 기대한다.

웹기반에서 애니메이션 기법을 이용한 학습평가 시스템 설계 및 구현 (Design and Implementation of Learning And Testing System using Animation Technique based on Web)

  • 원미해;현영숙;변옥남;김창수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.255-259
    • /
    • 2001
  • 대부분의 전자계산실무 교과 학습 관련 사이트들이 Text 위주의 나열식 학습평가가 대부분이나 본 논문에서는 빠른 속도로 출현하는 새로운 응용 프로그램의 활용을 필요로 하는 상업학교의 전자계산실무 교과목에 적용되는 학습평가를 웹을 기반으로 하여 이론과 실습을 교실에서 교사와 학생이 같이 수업을 하는 것처럼 WWW에서 애니메이션 기법을 이용하여 텍스트와 시각적, 청각적 기능을 포함한 자기주도적인 학습과 이전의 선발이나 배치의 목적으로 사용하기 위해 학습 결과를 양적으로만 측정해 온 것을 개개인의 특성을 고려한 평가 방법인 수준별, 개별화된 질적 평가가 가능하도록 설계 및 구현하였다.

  • PDF

웹에 기반한 국어 작문 학습시스템 구현 (Web-Based Intelligent Learning System for Korean Language)

  • 남현숙;권현주;김수남;유승훈;신민규;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.413-417
    • /
    • 1999
  • 최근 인터넷을 통한 언어 교육 연구에 관심이 고조되면서 다양한 언어 학습 홈페이지가 등장하였다. 이 논문은 국어 작문 학습을 목표로 본 연구실에서 개발한 '바른 우리글 쓰기' 학습시스템에 대해 다룬다. 본 학습 시스템은 초보자에서 전문가에 이르는 학습자를 대상으로 우리말로 글을 쓸 때 필요한 우리말 지식을 체계적으로 학습하도록 하거나 학습자가 직접 쓴 문장에서 스스로 오류를 찾아 분석하고 그에 따른 설명 및 글쓰기 규칙을 더 상세하게 알 수 있도록 설계하였다. 학습시스템의 내부 구조를 효율적으로 구성하기 위해 우리말 글과 관련 있는 자료를 수집하여 각각 지식베이스화하고, 학습 내용을 서로 체계적으로 연결하기 위해 우리나라 사람이 자주 틀리는 오류를 중심으로 해당 글쓰기 규칙과 참고 자료와 용례를 하이퍼텍스트화하였다. 이 시스템은 특히 학습 모형에 따라 학습 자료를 재구성할 수 있도록 지식베이스와 모형을 독립하였다. 이와 같이 학습 자료를 풍부하게 준비하고 학습 내용을 구성하는 일 만큼이나 중요한 과제는 학습자의 수준에 맞춰 학습 줄거리를 구성하는 작업이다. 이 시스템에서도 학습자의 특성을 살릴 수 있도록 연역적 학습 모형과 귀납적 학습 모형을 시도하였지만 더 세분화된 학습 줄거리 구성에 대한 연구가 있어야 한다. 따라서 학습자의 학습 동기를 유발할 수 있는 학습 내용과 적절한 기술이 조화를 이룬 홈페이지를 만드는 일이 향후 우리가 지향할 연구 과제이다.

  • PDF

Validation RDF 저작 툴의 설계 및 구현 (The Design and Implementation of Validation RDF Authoring Tool)

  • 조성훈;이무훈;손덕주;조현규;송병렬;이찬섭;최의인
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.208-210
    • /
    • 2002
  • 웹의 이용이 보편화되면서 웹 상의 자원(Resource) 또한 급격히 증가하고 있다. 이러한 상황에서 웹 자원을 효율적으로 기술할 수 있는 RDF(Resource Description Framework)는 웹 자원을 체계적으로 관리할 수 있는 지평을 열어주었다. 그러나 현재 RDF문서의 저작환경은 저차원적인 텍스트 편집 수준으로 파싱(parsing)과 유효성 검사(validation checking)를 지원하지 못하고 있는 실정이다. 따라서 본 논문에서는 저작환경을 개선함과 동시에 RDF 및 XML 문서에 대한 파싱 및 유효성 검사를 효율적으로 수행하고, RDF로 기술된 웹 자원을 n-triple 형식으로 생성할 수 있는 RDF 저작 툴을 설계 및 구현하여 유효성이 보장된 웹 자원을 효율적으로 생성 및 처리할 수 있도록 하였다.

  • PDF