• 제목/요약/키워드: 학습정보원

검색결과 68건 처리시간 0.026초

Korean Patent ELECTRA : 한국 특허문헌 자연어처리 연구를 위한 사전 학습된 언어모델(KorPatELECTRA) (Korean Patent ELECTRA : a pre-trained Korean Patent language representation model for the study of Korean Patent natural language processing(KorPatELECTRA))

  • 민재옥;장지모;조유정;노한성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.69-71
    • /
    • 2021
  • 특허분야에서 자연어처리 태스크는 특허문헌의 언어적 특이성으로 문제 해결의 난이도가 높은 과제임에 따라 한국 특허문헌에 최적화된 언어모델의 연구가 시급한 실정이다. 본 논문에서는 대량의 한국 특허문헌 데이터를 최적으로 사전 학습(pre-trained)한 Korean Patent ELECTRA 모델과 tokenize 방식을 제안하며 기존 범용 목적의 사전학습 모델과 비교 실험을 통해 한국 특허문헌 자연어처리에 대한 발전 가능성을 확인하였다.

  • PDF

딥러닝-규칙기반 병행 모델을 이용한 특허문서의 자동 IPC 분류 방법 (Hybrid Approach Combining Deep Learning and Rule-Based Model for Automatic IPC Classification of Patent Documents)

  • 김용일;오유리;심우철;고봉수;이봉건
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.347-350
    • /
    • 2019
  • 인공지능 관련 기술의 발달로 다양한 분야에서 인공지능 활용에 대한 관심이 고조되고 있으며 전문영역에서도 기계학습 기법을 활용한 연구들이 활발하게 이루어지고 있다. 특허청에서는 분야별 전문지식을 가진 분류담당자가 출원되는 모든 특허에 국제특허분류코드(이하 IPC) 부여 작업을 수행하고 있다. IPC 분류와 같은 전문적인 업무영역에서 딥러닝을 활용한 자동 IPC 분류 서비스를 제공하기 위해서는 기계학습을 이용하는 분류 모델에 분야별 전문지식을 직관적으로 반영하는 것이 필요하다. 이를 위해 본 연구에서는 딥러닝 기반의 IPC 분류 모델과 전문지식이 반영된 분류별 어휘사전을 활용한 규칙기반 분류 모델을 병행하여 특허문서의 IPC분류를 자동으로 추천하는 방법을 제안한다.

  • PDF

기계학습 기술을 활용한 화학분야 특허문서의 조성/물성 정보 자동추출 방법 연구 (A Study on the Automatic Extraction of Fomulation and Properties in Chemical Field Patent Document by Using Machine Learning Technology)

  • 김홍기;이하영;박진우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.277-280
    • /
    • 2019
  • 본 논문에서는 화학분야 특허 문서에 존재하는 도표(TABLE) 데이터를 인공지능 기술을 활용하여 자동으로 추출하고 정형화된 형태로 가공하는 방법을 제안한다. 특허 문서에서 도표 데이터는 실시예에서 실험결과나 비교결과를 간결하고 가시적으로 표현하기 위하여 주로 사용되나, 셀의 속성을 정의하는 헤더부분과 수치가 표현되는 값 부분의 경계가 모호하여 구조화하는데 어려움이 있다. 본 논문에서 제안하는 방법은 소량의 학습데이터를 구축하고 기계학습을 통해 도표에 존재하는 셀의 속성을 예측하고, 예측된 속성을 토대로 조성과 물성 정보를 자동으로 구분하여 추출하는 방법을 제시한다. 제시된 방법을 활용하여 화학 분야 조성물 특허의 도표데이터에 시뮬레이션 결과 각 항목별 98.17%의 속성 예측 정확도를 나타내었으며 기존 규칙기반 연구보다 작업난이도, 예측정확도에서 우수한 성과를 보인다.

  • PDF

대학생의 학습활동에 있어 도서관의 의미 - P대학도서관 이용자의 정보행태를 중심으로 - (Meanings of Academic Library in Learning Activities of Korean College Students)

  • 이은주;이제환
    • 한국도서관정보학회지
    • /
    • 제42권3호
    • /
    • pp.105-126
    • /
    • 2011
  • 이 연구는 대학생들을 사례로 하여 학습과 관련한 각종 활동의 실체를 파악하고 그러한 활동 과정에서 두드러지는 정보행태적 특징을 밝혀냄으로써 대학도서관 서비스를 '이용자 친화적'으로 혁신하기 위한 기초 자료를 확보하는 것을 목적으로 하고 있다. 이러한 목적을 성취하고자 이 연구에서는, 첫째, 대학생의 학습활동을 분석하여 유형화하고 학습활동의 유형에 따른 정보행태적 특징을 밝혀내었으며, 둘째, 정보행태적 관점을 중시하면서 학습정보원으로서 대학도서관이 갖는 비중과 이용행태를 파악하였고, 마지막으로, 대학도서관이용에 영향을 미치는 인적 변인을 드러내고 그러한 변인에 따른 도서관이용행태의 차이를 밝혀내었다. 연구에 필요한 데이터는 290명의 대학생을 대상으로 한 설문조사를 통해 수집하였으며, 수집한 데이터는 빈도분석과 교차분석을 거쳐 논점의 전개를 위해 활용하였다.

초등학교 교사의 정보 요구 및 이용 행태에 관한 연구 (A Study on Information Need and Use Behavior of Elementary Teachers According to Their Task)

  • 이승민;정지운
    • 한국도서관정보학회지
    • /
    • 제52권2호
    • /
    • pp.209-233
    • /
    • 2021
  • 본 연구는 초등교사들의 정보추구행태를 분석하여 학교도서관의 교육정보서비스 개발에 시사점을 얻는데 목적을 두고 있다. 이에 초등교사 11명을 대상으로 심층 면담을 실시하여 초등교사들이 인식하는 역할과 업무에 대한 인식을 분석하고, 이에 따른 정보 요구와 주 정보원을 파악하였다. 분석 결과 초등교사들은 자신의 역할과 업무를 담임 업무, 교수·학습활동, 학교 담당 업무, 기타 업무 순으로 그 중요성을 인식하고 있었으며, 이에 따라 웹정보 및 인적 정보, 도서 정보 등을 정보원으로 활용하고 있었다. 각 역할과 업무에 따라 웹정보 또는 인적 정보를 주로 활용하는 것으로 나타났으며, 초등교사 간 웹 커뮤니티가 주 정보원으로 인식되는 경향을 보였다. 이에 학교도서관에서 운영하는 다양한 교육정보를 많은 초등교사들이 이용하는 웹 정보원에서 공유하는 것, 초등교사들과 학습 공동체 형성을 통해 협력적 교육 정보서비스를 제공하는 것, 학교도서관을 통해 다양한 담임 업무 관련 도서를 제공하는 것 등을 제안하였다.

XML 기반 ICT 활용 교수-학습 과정안 설계 및 구현 (Design and Implementation of Teaching-Learning Plan using ICT based on XML)

  • 김민호;차영욱;김중수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.653-656
    • /
    • 2004
  • 교육인적자원부의 ${\ulcorner}$${\cdot}$중등학교 정보통신기술 교육 운영지침${\lrcorner}$에 따르면 각 교과 수업 시간에 ICT 활용 교육이 $10\%$이상 반영되도록 적극 권장하고 있다. 이에 따라 각급 학교에서는 전통적인 학습 지도안과 ICT 활용 교수-학습 과정안의 두 가지 형태를 병행하여 사용하고 있으나 작성 도구와 형식이 다양하여 교사들 상호간의 문서 공유와 재사용성이 떨어지며 웹 상에서 정확한 검색이 어렵다. 본 논문에서는 한국교육학술정보원에서 제시하고 있는 ICT 활용 교수-학습 과정안의 모형을 토대로 공통 DTD를 설계하고 데이터베이스와 연동하여 표준화된 XML 문서를 생성함으로써 교사들 상호간의 공유 및 재사용성을 높이고 정확한 검색이 이루어지도록 하였다. 또한 유선 인터넷 서비스와 동시에 무선 인터넷 환경에서도 WML을 이용하여 모바일 서비스가 가능하도록 구현되어 있어 보다 향상된 교수-학습 환경을 제공할 수 있다.

  • PDF

점진적 빅데이터 학습기반의 전자저널 구독가치 큐레이션 서비스 (Journal Subscription Value Curation Service Based on Incremental Big Data Learning)

  • 이정원;진성일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.409-410
    • /
    • 2019
  • 점진적 빅데이터 학습 기반의 전자저널 구독가치 큐레이션 서비스는 대용량의 학술정보 처리환경을 하드웨어 기반에서 소프트웨어 기반으로 데이터를 학습함에 있어 학습 소요시간 및 메모리 부족 문제 등을 해결하기 위해 널리 사용하는 자질축소 기법에 의존하지 않고 대량의 데이터를 자유롭게 학습하고 증분 데이터 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법이다. 학술정보의 논문요약과 참고문헌의 데이터 수집 정제 분류 저장 분석을 통해 활용할 수 있는 지표를 생성하여 도서관 학교 공공기관 연구기관 등에 제공하여 기관에서 구독하고 있는 학술지가 연구에 얼마나 활용되고 있는지를 판단하는 정보 가용성을 활용한 양질의 정보원을 확보하여 불필요한 저널 구독을 중단하고 연구자가 요구하는 품질 좋은 학술정보를 제공할 수 있는 서비스로 일반적인 학술문헌 이용도 평가방법과 달리 구독 가치에 대한 지표를 제공하는 큐레이팅 방법이다.

  • PDF

블로그 포스트 자동 품질 평가를 위한 기계학습 기법 비교 연구 (A Comparison of Machine Learning Techniques for Evaluating the Quality of Blog Posts)

  • 한범준;김민정;이형규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.385-388
    • /
    • 2010
  • 블로그는 다양한 주제 분야에 대한 내용을 자유롭게 표현할 수 있는 일종의 개인 웹사이트로, 많은 양과 다양성으로 매우 중요한 정보원이 될 수 있다. 블로그는 생산속도가 매우 빠르므로 보다 고품질의 블로그를 선별하는 것이 중요하다. 본 논문에서는 블로그의 본문을 담고 있는 포스트를 대상으로 기계학습 기법을 이용하여 문서의 품질을 자동으로 평가하고자 하였다. 학습을 위한 자질로는 모든 블로그에 공통적으로 적용할 수 있도록 형태소 분석에서 추출한 동사, 부사, 형용사의 내용어만을 선택하였다. 성능 비교를 위해 수작업으로 약 4,600개의 정답 집합을 구축하고, 적합한 기계학습 기법을 찾기 위해 다양한 학습 기법을 사용하여 비교 실험하였다. 실험 결과 Bagging 기법의 성능이 79% F-measure로 가장 좋음을 보여주었다. 한정된 자질을 사용했을 때와 정답 집합의 문서 수 비율이 불균등할 경우 단순함, 유연성, 효율성의 특징을 지닌 Bagging 기법이 적합할 것으로 보인다.

U-러닝에서 UMPC의 역할에 대한 연구 (A Study on UMPC's Role in u-Learning)

  • 이문호;김미량
    • 인터넷정보학회논문지
    • /
    • 제9권6호
    • /
    • pp.127-139
    • /
    • 2008
  • UMPC(Ultra Mobile Personal Computer)와 같은 최첨단 모바일 PC는 이동용이성과 실시간 의사소통 가능성 등의 특징과 동료학생과의 대화, 학습 자료의 자유로운 송부 및 공유 등과 같은 학습활동이 요구되는 학습 환경에서 그 가치를 크게 인정받고 있다. 본 연구에서는 초등학교 5학년 과학시간에 한국학술정보원(KERIS)에서 제시한 u-러닝통합탐구모형을 중심으로 UMPC를 활용하는 수업을 전개하고, 학습 활동전개과정에서 의미 있는 요소를 찾아내어 UMPC가 u-러닝에서 의미 있는 역할을 하고 있는지 알아보고자 하였다. 본 연구결과에서 UMPC의 역할은 수업전개에서 학습활동과 관계가 될 수 있는 요소로 활용되지만 학습활동 중에 교사와 지속적인 피드백이 있어야만 UMPC가 학습활동의 역할을 담당할 수 있었다.

  • PDF