• 제목/요약/키워드: 문서 주제

검색결과 329건 처리시간 0.024초

기록관리 분야 국가연구개발사업 현황 분석 (An Analysis of the Status of National Research and Development Projects in Records Management)

  • 정회명;김순희
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.137-157
    • /
    • 2023
  • 기술혁신을 통한 국가경쟁력 강화를 목적으로 연구개발 투자 규모가 증가하고 있으며, 투자 효율성에 대한 관심이 높아지고 있다. 기록관리 분야에서는 국가기록원이 2008년부터 국가연구개발사업을 주도하고 있다. 이에 본 연구는 2008년부터 2022년까지의 국가기록원 용역 연구과제 111건을 대상으로 수행주체, 성과, 주제 등의 측면에서 기록관리 분야 연구개발사업을 분석하였다. 분석 결과, 연구 수행주체는 중소기업, 연구성과는 학술발표가 가장 많았으며, 연구보고서의 성과와 실제 성과 간 일부 차이가 있었다. 연구 주제 측면에서 기록물 형태는 종이문서, 국가기록원 업무 중에서는 전자적 관리체계 구축, 기록관리 업무 과정과 연구과제별 중심단어 빈도 기준으로는 보존에 대한 연구가 주로 수행된 것으로 나타났다. 디지털 전환 관련 빅데이터 활용과 지능형 기술 개발의 측면에서는 111개 과제 중 9%인 10건이 해당하는 것으로 나타났다. 따라서 연구 사업 종료 후에도 성과에 대한 사후 관리를 통해 연구개발사업의 효과성을 높여야 할 것이며, 연구 주제에 있어서는 보존 이외의 이관, 분류, 평가, 생산, 수집 등에 대한 연구와 디지털 전환에 대응하는 연구의 필요성을 확인하였다.

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.

악곡구조 분석과 활용 (Music Structure Analysis and Application)

  • 서정범;배재학
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.33-42
    • /
    • 2007
  • 본 논문에서는 음악수사법에 기초하여 악곡요약을 구현할 새로운 악곡구조 분석 방법론을 소개한다. 이 방법론에서는 악곡 구성요소 간의 유사도 분석을 통해 악곡의 결합구조를 파악한 뒤, 결합구조에서 해당 곡이 취하고 있는 음악양식을 추정한다. 그 후 악식의 음악적 수사구조가 가지는 전통적인 특징과 표현기법을 근거로 악곡구조 안에서 주요선율을 추출한다. 문서요약의 경우와 같이 주어진 악보에서 추출된 주요선율은 그 곡의 요약이라고 간주할 수 있다. 개발한 악곡구조 분석 방법론은 대중음악 사례를 통하여 그 효용성을 가늠해 보았다.

국제연합 전문기구의 정보원과 이용에 관한 연구 (Information Sources and Use of the UN Specialized Agencies)

  • 이숙희
    • 한국문헌정보학회지
    • /
    • 제38권2호
    • /
    • pp.5-27
    • /
    • 2004
  • 이 연구의 목적은 국제기구 연구의 기초가 될 주요 정보원과 정보서비스의 특징을 분석하여 국제기구 정보원에 대한 접근 및 이용의 효율성을 증진시키는데 있다. 경제, 환경, 문화, 교육, 보건 및 관련 분야의 국제협력을 도모하고 있는 16개 국제연합 전문기구를 대상으로 각 기구의 목적과 기능을 개관하고, 웹상에서 확인할 수 있는 각 기구의 문서 및 출판물의 종류와 주제별 특성, 도서관 정보서비스 그리고 그 정보원의 식별과 접근을 도와주는 도구 및 시스템들을 살펴보았으며 효율적인 전문기구 정보서비스를 제공하기 위한 방안들을 논의하였다.

정보 추출을 위한 이벤트 문장 추출 (Event Sentence Extraction for Information Extraction)

  • 김태현;임수종;윤보현;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.325-331
    • /
    • 2002
  • 정보추출 시스템의 목적은 관심의 대상이 되는 특정 정보를 선택적으로 찾아내 제시하는데 있다. 따라서 도메인 정보에 의존적인 방법으로 정보추출이 이루어질 수밖에 없고, 이에 따른 도메인 정보 구축의 부담이 컸다. 이러한 부담을 줄이기 위해 본 연구에서는 특정 주제영역과 관련한 문서로부터 자동으로 이벤트 문장을 추출하는 시스템을 제안한다. 이벤트 문장이란, 특정도메인에서 다루어지는 이벤트의 구체적인 내용을 포함하고 있는 문장이다. 이러한 문장을 추출함으로써 기본적인 수준의 정보추출 요구를 만족시킬 수 있을 뿐만 아니라, 주출된 이벤트 문장을 도메인 정보 구축에 활용할 수 있을 것이다. 본 연구에서는 동사, 명사, 명사구, 및 3W 자질을 이용하여 문장추출의 성능을 최대화하기 위한 방안을 제안하고, 세 개의 평가 도메인을 대상으로 실험을 수행하였다. 실험 결과, when 및 where 자질과 동사, 명사. 명사구의 가중치를 이용하여 문장 가중치를 계산함으로써 최적의 이벤트 문장추출 성능을 얻을 수 있음을 알 수 있었다.

  • PDF

기술문서 분류를 위한 통계기반 기계학습 모델 성능비교 및 한계 연구 (Performance Comparison of Statistics-Based Machine Learning Model for Classification of Technical Documents)

  • 김진구;유헌창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.393-396
    • /
    • 2022
  • 본 연구는 국방과학기술 분야의 특허 및 논문 실적을 이용하여 통계기반 기계학습 모델 4 종을 학습하고, 실제 분석 대상기관의 데이터 입력결과를 분석하여 실용성에 대한 한계점 분석을 목적으로 한다. 기존 연구에서는 특허분류코드를 기준으로 분류하여 특수 목적으로 활용하거나 세부 연구 범위 내 연구 주제탐색 및 특징연구 등 미시적인 관점에서의 상세연구 활용 목적인 반면, 본 연구는 거시적인 관점에서 연구의 전체적인 흐름과 경향성 파악을 목적으로 한다. 이에 ICT 기술 138 종의 특허 및 논문 30,965 건과 국방과학기술 192 종의 특허 및 논문 23,406 건을 학습데이터로 각 모델을 학습하였다. 비교한 통계기반 학습모델은 Support Vector Machines, Decision Tree, Naive Bayes, XGBoost 모델이다. 학습데이터에 대한 학습검증 단계에서는 최대 99.4%의 성능을 보였다. 다만, 실제 분석대상기관의 특허 및 논문 12,824 건으로 입력분석한 결과, 모델별 편향성 문제, 데이터 전처리 이슈, 다중클래스 및 다중레이블 문제를 확인, 도출한 문제에 대한 해결방안을 제시하고 추가 연구의 방향성을 제시한다.

디지털 아카이브즈의 문제점과 방향 - 문화원형 콘텐츠를 중심으로 - (Digital Archives of Cultural Archetype Contents: Its Problems and Direction)

  • 함한희;박순철
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.23-42
    • /
    • 2006
  • 본고는 문화원형콘텐츠를 유통시키고 있는 문화콘텐츠닷컴의 디지털아카이브 시스템에 주목해서 문제점을 분석하고 대안을 제시하는 것이 목적이다. 문화원형콘텐츠는 전통문화와 컴퓨터기술을 접목시켜 개척한 새로운 분야이다. 정부에서는 이 산업을 육성해서 한국문화의 세계화와 국가 경쟁력을 강화시킬 의도를 가지고 있다. 우리나라의 역사와 전통 풍물 생활 전승 예술 지리지 등 다양한 분야의 문화원형을 디지털 콘텐츠화하여 문화산업에 필요한 창작소재로 제공하는 것이 그 핵심내용이다. 아울러 디지털 콘텐츠 유통체계 정립과 저작권 관리를 통해서 공공부문 문화콘텐츠의 산업적 활용도를 제고하려는 의도도 포함된다. 본고에서 다루는 대상자료는 현재 문화콘텐츠닷컴에서 유통, 관리되고 있는 문화원형콘텐츠들이다. 이 성과물들은 2002년부터 2005년까지 개발되어서 문화콘텐츠닷컴 DB에 구축되어 있다. 이 자료들을 통해서 현재의 디지털아카이브 시스템의 문제점을 분석하였고, 현재의 시스템이 안고 있는 한계점을 요약하면 다음과 같다. 첫째는 각 자료에서 사용하는 주요 용어의 선택에 따라 유사한 자료들이 서로 다른 주제로 분류되면서 다른 항목에 속하게 되는 것이다. 둘째는, 따라서 서로 다른 항목 간에 교차검색이 이루어지지 않는 한계점이 있다. 현재의 제 문제를 해결할 수 있는 방법으로 본고에서는 온톨로지 기능을 포함한 데이터마이닝시스템을 이용해서 풍부한 지식정보표현과 활용이 가능한 디지털아카이브 시스템을 제안하고 있다. 데이터마이닝은 다섯 가지의 방법으로 가능하다. 의미검색 문서요약 문서클러스터링 문서분류 그리고 주제추적이다. 최근에 빠르게 개발되고 있는 디지털 신기술도 인문학과 긴밀하게 연결되지 않으면, 그 활용도가 제한적이라는 점을 본고를 통해서 지적하였다. 창작소재로서의 문화원형콘텐츠의 활용도를 크게 향상시킬 수 있는 길은 바로 신지식관리를 위한 통학적(uni-discipline) 접근이라는 점을 일깨우고자 한다.

LDA, Top2Vec, BERTopic 모형의 토픽모델링 비교 연구 - 국외 문헌정보학 분야를 중심으로 - (A Comparative Study on Topic Modeling of LDA, Top2Vec, and BERTopic Models Using LIS Journals in WoS)

  • 이용구;김선욱
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.5-30
    • /
    • 2024
  • 이 연구는 토픽모델링 모형인 LDA, Top2Vec, BERTopic을 대상으로 실험데이터에서 토픽을 추출하고, 그 결과를 비교 분석함으로써 각각의 모형 간의 특성과 차이를 파악하는데 목적이 있다. 실험데이터는 Web of Science(WoS)에 등재된 문헌정보학 분야 학술지 85종에 게재된 논문 55,442편을 대상으로 하였다. 실험 과정으로 우선 각 모형의 파라미터를 기본값 그대로 이용하여 1차 토픽모델링 결과를 얻었고, 최적의 토픽 수를 설정하여 각 모형의 2차 토픽모델링 결과를 얻었으며, 이들을 각 모형과 단계별로 비교분석하였다. 1차 토픽모델링 단계에서는 LDA, Top2Vec, BERTopic 모형이 각각 100개, 350개, 550개의 토픽을 생성하여 세 모형은 각각 매우 다른 크기의 토픽 개수를 가져왔으며, LDA 모형에 비해 Top2Vec이나 BERTopic 모형이 토픽을 3배, 5배 더 세분화하였다. 또한 세 모형은 토픽 당 문서 수의 평균이나 표준편차에서도 많은 차이가 났다. 구체적으로 LDA 모형은 비교적 적은 수의 토픽에 많은 문서를 부여하는 반면, BERTopic 모형은 반대의 경향을 보였다. 25개의 토픽 수를 생성하는 2차 토픽모델링 단계에서는 다른 모형에 비해 Top2Vec 모형이 평균적으로 토픽 당 많은 문서를 부여하고 토픽간에 고르게 문서를 할당하여 상대적으로 편차가 작았다. 또한 모형간의 유사 토픽의 생성여부를 비교하면, LDA와 Top2Vec 모형이 전체 25개 중에 18개(72%)의 공통된 토픽을 생성하여 BERTopic 모형에 비해 두 모형이 더 유사한 결과를 보였다. 향후 토픽모델링 결과에서 각 토픽과 부여된 문서들이 주제적으로 올바르게 형성되었는지에 대한 전문가의 평가를 통해 보다 완전한 분석이 필요하다.

기록관리전문가의 양성교육에 관한 사례연구 -이탈리아의 기록관리학 전통과 교육과정을 중심으로- (A study on the case of education to train an archivist - Focus on archival training courses and the tradition of archival science in Italiy -)

  • 김정하
    • 한국기록관리학회지
    • /
    • 제1권1호
    • /
    • pp.201-230
    • /
    • 2001
  • 기록들은 이전 사회의 모든 분야의 삶에 대한 기록된 흔적이자 증언이다. 기록문화유산을 보존하는 것은 물론 우리 모두의 사명이지만, 특히 관리 및 보존의 임무는 기록물관리에 대한 전문지식을 갖고 있는 기록관리전문가들의 몫이다. 기록관리전문가는 단지 오래된 기록물만을 보존하는 것이 아니라 과거의 문서를 오늘날의 역사기록물로 정의하기, 위한 미래적 안목의 평가와 선별작업을 수행하여야 한다. 일반적으로 기록관리학의 범위는 기록물의 생산에서 영구보존에 이르기까지 방대하며, 내용적으로는 크게 업무 및 행정기록물관리와 역사기록물관리의 두영역으로 이루어져 있다. 이탈리아의 경우 18세기말과 19세기초 구지도의 종말과 복원의 시대를 배경으로 원래의 질서를 상실한 채 방치된 수많은 문서들에 대한 정리작업의 필요성을 계기로 성립된 '역사기록물관리'가 기록관리학의 전통영역으로 대변된다. 이 당시의 오늘날의 십진법적 분류와 유사한 '주제별 정리방식'이 실험적으로 이루어졌다. 또한 기록물정리방식과 그 이론적 배경, 대규모 기록보존소의 설립, 그리고 기록물의 법칙, 문화적 가치 및 활용 등의 개념들이 기록관리전문가의 포괄적이고 전문적인 활동내용으로 규정되었다. 특히 이 시대에는 기록관리학이 중세문서들의 형태와 내용, 그리고 문서들의 다양한 서체와 기록배경에 대한 학문적 해석을 통해서 기록물을 역사연구에 활용하려는 고문서학 및 고서체학적 전통의 보조수단으로 인식되기도 하였다. 근현대의 기록관리는 고문서관리라는 전통영역이외에도 업무 및 행정기록물의 생산에서 등록, 분류, 편철, 활용, 선별 그리고 이관 등에 관한 종합적인 관리를 포함하게 되었다. 따라서 오늘날 기록관리전문가의 활동영역은 기록물의 행정적 가치에서 역사, 문화적 가치에 이르는 전과정의 흐름을 제도적으로 보장하는 것으로 정의되고 있다. 기록관리학에 대한 기본교육의 핵심은 역사와 법으로 구성된다. 기록관리전문가에게 법연구가 필요한 것은 기록보존소가 법적 행정적인 활동으로 생산된 문서들을 대상으로 과학적 관리활동을 수행하는 연구기관이기 때문이다. 비록 기록관리전문가들이 어떤 분야의 전문지식과 학위를 취득해야만 하는가에 대해서는 이견이 많지만 기능성 차원에서 역사관련 학문분야를 선호하며, 기록관리전문가 자신의 신념이나 이념의 보편적인 테두리를 갖기 위해 법학연구도 강조되고 있다. 20세기 접어들면서 기록보존소가 문화기관에 예속되는 경향이 우세해져 행정기관들이 기록보존소를 관리하던 과거의 전통에 대한 반발이 커지기도 하였지만 이러한 현상은 큰 영향을 불러일으키지는 못하였다. 이탈리아의 기록관리 교육은 토리노, 밀라노, 베네치아, 베노바, 볼로냐, 파르마, 로마, 나폴리, 팔레르모 등 대략 9곳의 국립기록보존소를 중심으로 이루어졌다. 이 시기의 교육과정은 대부분 고서체학과 고문서학 강의가 대부분이었으며, 여전히 기록관리학에 대한 교육은 실시되지 않았다. 1884년에 바티간의 비밀기록보존소는 '고서체학 교육과정'을 설치하였으며, 이 과정은 40년 후인 1923년에야 1년 단위의 기록관리학 과정으로 재편성되면서 명실상부한 <<고서체학, 고문서학, 그리고 기록관리학>>의 교육과정으로 발전하였다. 19세기말 20세기에 접어들면 국립기록보존소들의 교육과정에서 가장 기본적인 과목은 고서체학과 고문서학이 아니라 오히려 기록관리학임이 재차 강조되었다. 특히 고서체학과 고문서학에 대한 기록관리학은 우월을 강조하는 카사노바의 소신은 시사하는 바가 크다. 그는 고서체학, 고문서학, 그리고 기록관리학이 모두 필수적이며, 문장학, 가계학, 그리고 인장학에 대한 교육과 더불어 완성된다고 보았다. 그러나 기록보존소의 모든 기록들의 고서체학자와 고문서학자 등의 개입을 필요로 하지는 않는다. 반면에 모든 문서들은 기록관리전문가의 도움을 필요로 한다. 기록관리학의 목적은 기록 보존소에 기록물을 이관한 제도와 기관들을 연구하고, 관리들이 어려움없이 모든 것을 쉽게 이해하고 각 기관들의 고유한 업무절차와 업무분단에 대한 무지속에서 헤메지 않고 자신들의 할 일을 분명하게 알게하도록 하려는 것이다. 이처럼 문서를 생산한 기관과제도들의 역사에 대한 연구는 이미 몇십년부터 기록관리학의 한분야로 자리잡았다. 기록관리학이 많은 사람들의 공감대를 형성하지 못하고 학문으로서의 길고 어려운 여정을 겪는 동안 이탈리아뿐만 아니라 여러 국가의 기록보존소들은 역사를 비롯한 타학문가의 전문가들을 포함한 기록관리학의 버전문가들에 의해 운영됨으로써 많은 폐단을 겪게 되었다. 많은 기록물들이 도서관 사서들의 방식과 스타일에 따라 혹은 역사가들이 주장하는 주제별 분류방식에 따라 정리되었기 때문에 자국의 경험에 기초하여 마련된 기록물의 본래의 구조 즉 원 질서가 완전히 파괴되었다. 20세기 미국의 경우에도 도서관에 관련된 학문에 있어서는 다른 나라들에 비해 상당히 앞서 있었지만, 기록관리학에 있어서는 후진성을 면치 못하고 있었다. 이탈리아의 기록관리전문사 양성을 위한 전문교육과정은 1925년 로마 국립대학교의 사회과학대학원을 배경으로 성립되었다. 대학의 기록관리교육은 역사, 법, 경제에 대한 열정으로 여러 국립기록보존서들에 기록관리교육이 정식 전문교육과정으로 정착되었다. 볼로냐 국립기록보존소의 '기록관리학, 고서체학 그리고 고문서학의 전문교육과정'은 이탈리아의 17개 국립기록보존소들에서 실시하고 잇는 교육과정들 중의 하나이다. 본 교육과정은 무료이며, 2년동안 8개의 과목(기록관리학, 고서체학, 고문서학, 기록보존소의 역사, 공증인제도와 사문서, 중세의 제도사, 근대의 제도사, 현대의 제도사 등) 중에 7개의 과목을 이수하는 것으로 구성된다. 2년의 학위과정은 2회의 필기시험관 1회의 구두시럽으로 마감된다. 최종시험성적이 문화환경부에 의해 종합되면 볼로냐 국립기록보존서의 소장은 시험을 통과한 수강생들에게 '기록관리학, 고서체학 그리고 고문서학 학위'를 수여한다. 이 학위증은 도, 지방 그리고 지방의 행정수도에 위치한 기록보존소와 특별히 중요하다고 판단되는 자치도시의 조합기록보존소 및 다른 기관들의 기록 보존소에 근무할 수 있는 필수적인 자격조건을 구성한다. 바티칸의 기록보존소에서 교수되는 내용은 다른 교육과정들과 비교하여 근본적인 차이는 없다. 그러나 과거의 역사에서 독립된 영토단위와 영적, 세속적 권력을 행사하였던 관계로 과목게 있어서 보다 전문적이고 세밀한 교육내용을 추구하고 있다. 필수과목으로는 기록관리학, 필사본학, 일반 고문서학, 교황청 고문서학 그리고 라틴 고서체학이 있다. 이외에도 강독실습과 구두를 통한 이론연습이 있으며, 문장학, 인장학, 상식문자의 역사, 교황청의 역사 등 인접분야 혹은 보조학문에 대한 교육도 선택적으로 실시된다. 이탈리아의 기록관리전문가를 위한 전문교육은 현장실습을 통해 과거의 문화유산에 대한 직접적인 접촉을 유도하고, 기록물 전체에 대한 관심에 앞서 각 문서에 대한 쵠화력을 가오하하려는 의도는 반영하고 잇다. 또한 기록관리 현장에서 기록관리전문가의 양성을 위한 교육을 실시한다는 발상은 역사적으로 해당지역의 독특한 발전과정을 증언하는 국립기록보존소들의 고유한 특성과 연계하여 지역문화유상을 보존하려는 보다 적극적인 문화정책의 일환으로 평가된다. 이탈리아 기록관리전문가를 위한 교육과정이 우리에게 시사하는 바를 정리하면 다음과 같다. 첫째, 이탈리아의 교육과정 대부분이 역사기록물에 대한 관리를 중심으로 계획된 반면에 업무 및 행정기록물에 대한 프로그램은 상당히 미미하다. 그러나 기록물 생산에서 영구보존에 이르기까지 역사기록물의 정리방식으로 원 질서 즉 생산당시에 부여된 최초의 질서를 존중하는 원칙이 채택되고 있으므로 업무 및 행정기록물에 대한 관리 역시 역사기록물의 관리체계와 일관성을 가지고 있다. 둘째, 17개의 국립기록보존시를 배경으로 기록관리전문가를 위한 전문교육과정이 운영되고 있다. 비록 대학의 기록관리교육이 활성화되지 못한 것이 자격과 능력을 겸비한 전문가의 부족때문이기도 하였지만, 이탈리아 국립기록보존소들이 교육과 이론보다는 기록관리의 일선에서 활동할 인력을 양성하는데 치중한 결과이다. 셋째, 역사문서들에 대한 연구를 위한 고문서학과 고서체학이 기록관리학을 지원하고 있다는 사실이다. 넷째, 이탈리아의 과거사 연구가 기록보존소를 중심으로 기록관리전문가와 역사가의 상호보완적 관계를 통해 진행되고 잇다는 것이다. 이러한 기록보존소의 역사기록물을 공통문모로 하는 역사연구의 방법론은 거시사연구보다는 각 지역이나 소단위 연구주제의 독특한 역사발전상황을 존중하는 미시사적 연구방법론이 정착되는데 기여하였다는 것이다. 이제 우리의 과제는 기록물을 관리할 주체에 관한 논쟁이 아니라 기록물의 다양한 그리고 그 가치를 훼손시키지 않는 방식으로 문서들을 책임질 능력과 통찰력 그리고 탄력적인 사고를 가진 기록관리전문가를 정하는 것이다. 그리고 궁극적으로는 이러한 전문가들을 양성하기 위한 교육과정을 준비하고 이들이 기록관리의 현장에서 신념을 갖고 종사할 수 있는 터전을 마련하는 것이다.

광고 글 필터링 모델 적용 및 성능 향상 방안 (Application of Advertisement Filtering Model and Method for its Performance Improvement)

  • 박래근;윤혁진;신의철;안영진;정승도
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-8
    • /
    • 2020
  • 최근 기하급수적인 인터넷 데이터의 증가로 딥러닝 등의 많은 분야가 발전하였지만 바이럴 마케팅(viral marketing)과 같은 상업적 목적의 광고가 발견되면서 정보증가의 부작용이 발생하고 있다. 이는 양질의 정보를 공유하고자 하는 인터넷의 본질을 훼손하고 있을 뿐만 아니라 사용자는 양질의 정보를 습득하기 위해 검색시간이 증가하는 문제가 야기된다. 이에 본 연구에서는 광고(Ad: Advertisement, 이하 Ad) 글을 정보 전달의 본질을 흐리는 내용의 글이라 정의하였으며 본 정의에 부합하는 정보로 필터링하는 모델을 제안하였다. 제안하는 모델은 광고 필터링 경로와 광고 필터링 성능 개선경로로 구성되었으며 지속적으로 성능이 개선되도록 설계하였다. 광고 글 필터링을 위해 데이터를 수집하고 KorBERT를 사용하여 문서분류를 학습하였다. 본 모델의 성능을 검증하기 위해 실험을 진행하였으며 5개의 주제를 통합한 데이터에 대한 정확도(Accuracy), 정밀도(Precision)는 각각 89.2%, 84.3%의 결과를 나타냈고 광고의 비정형적 특성을 고려하더라도 높은 성능이 보임을 확인하였다. 본 모델을 통해 바이럴 마케팅으로 구성된 문서에서 광고 문단을 판단하고 필터링하여 사용자에게 양질의 정보를 효과적으로 전달하며 검색하는 과정에서 낭비되는 시간과 피로가 감소할 것으로 기대된다.