• 제목/요약/키워드: Service Bulletin

검색결과 121건 처리시간 0.024초

천문 고문헌 특화 인공지능 자동번역 서비스의 현황 (Current status of automatic translation service by artificial intelligence specialized in Korean astronomical classics)

  • Seo, Yoon Kyung;Kim, Sang Hyuk;Ahn, Young Sook;Choi, Go-Eun;Choi, Young Sil;Baik, Hangi;Sun, Bo Min;Kim, Hyun Jin;Choi, Byung Sook;Lee, Sahng Woon;Park, Raejin
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.64.3-65
    • /
    • 2021
  • 인공지능 기계학습에 의한 한문고전 자동번역기는 승정원일기 뿐만 아니라, 한국 고문헌 중 천문 기록에 특화되어 한자로 된 천문 고전을 한글로 번역해 서비스하고 있다. 한국천문연구원은 한국지능정보사회진흥원이 주관하는 2019년도 Information and Communication Technology 기반 공공서비스 촉진사업에 한국고전번역원과 공동 참여하여 이 자동 번역기 개발을 완료한 것이다. 이 번역기의 개발 목적은 초벌 번역 수준일지라도 문장 형태의 한문을 한글로 자동 번역하는 것이며, 이 연구는 현재 번역기 운용 현황을 서비스 별로 분석하고자 한다. 자동 번역관련 서비스는 크게 3가지이다. 첫째, 누구나 웹 접속을 통해 사용 가능한 한문고전 자동번역 대국민 서비스이다. 1년간 자체 시험을 거쳐 2021년 1월 12일 시험판을 오픈하여 운용 중에 있다. 둘째, 기관별로 구축된 코퍼스와 도메인 특화된 번역 모델 등을 관리할 수 있는 한문고전 자동번역 확산 플랫폼 서비스이다. 대국민 서비스와 함께 클라우드 기반으로 서비스되며, 한국고전번역원이 관리를 담당한다. 셋째, 자동번역 Applied Programmable Interface를 활용한 한국천문연구원 내 자체 활용이 가능한 천문고전 자동번역 서비스이다. 서비스 현황 분석은 기관별 관리 서비스에 해당되는 한문고전 자동번역 확산 플랫폼에서 집계하여 제공하는 대시보드의 통계 기능을 활용한다. 각 서비스별 문장과 파일 번역 이용 건수, 번역 속도, 평균 자수 뿐만 아니라, 번역 모델 프로필에 따른 이용률 분석이 가능하다. 이에 따른 주요 분석 중 하나인 올해 전체 번역 이용 건수는 한 해 각 기관의 평균 방문자수 대비 87% 성과 목표에 해당되는 약 38만 건에 근접할 것으로 예측된다. 이 자동 번역기는 원문 해독 시간을 단축시키는 효과와 함께 미번역 천문 고문헌의 활용성을 높여 다양한 연구에 기여할 것이다.

  • PDF

전국색인지간행협동체제 편성방안에 관한 연구 (A Study on the Planning of Nationwide Indexing Services for Korea)

  • 최성진
    • 한국문헌정보학회지
    • /
    • 제12권
    • /
    • pp.39-86
    • /
    • 1985
  • The main purpose of the present study is to survey the major iudexing bulletins of national nature in Korea, to define such problem areas as lacunae, duplicates and limitation in coverage in the indexing services currently available in Korea, and to make some suggestions for action for improving the existing indexing services in the light of general principles and the tradition and constraints unique to Korea. The major findings and conclusions reached at this study are summarised as follows: (A) A new indexing bulletin of general nature covering the entire field needs to be created in each of the following fields without an established indexing service available for the outcome of research and development activities in Korea. (1) Philosophy (2) Religion (3) Pure sciences (4) Art (5) Language (6) Literature (7) History (B) A new specialised indexing bulletin needs to be created in each of the following fields where indexing services are heavily utilised but no, or only partial, indexing service is available. (1) Social sciences (a) Statistics (b) Sociology (c) Folklore (d) Military science (2) Pure sciences (a) Mathematics (b) Physics (c) Chemistry (d) Astronomy (e) Geology (f) Mineralogy (g) Life sciences (h) Botany (i) Zoology (3) Applied sciences (a) Medicine (b) Agriculture (c) Civil engineering (d) Architectural engineering (e) Mechanical engineering (f) Electrical engineering (g) Chemical engineering (h) Domestic science (C) Publication of the indexing bulletins suggested in A and B above may be ideally carried on by a qualified and dependable learned society established in the respective fields and designated by the Minister of Education, and should be financially supported from the public fund under the provisions of Art. 27 of the Scientific Research Promotion Act of 1979. (D) The coverage and contents of the four indexing bulletins in the field of banking and financing published by the Library of the Bank of Korea are similar and considerably duplicated. It is, therefore, suggested that the four indexing bulletins are combined in one to form a more comprehensive and efficient bibliographical tool in the field and it is further developed into a general guide to the literature produced in the entire field of economics in Korea by gradually expanding its subject coverage. (E) For the similar reasons stated in D, the Index to the Articles on North Korea and the Catalogue of Theses on North Korea, both publisheds by the Ministry of Unification Library, are suggested to make into one. The Index to the Articles of the Selected North Korean Journals and the Index to the Articles of the North Korean Journals in Microfilm Housed in the Ministry of Unification Library, both published by the same Library, are also suggested to be combined in one. (F) The contents of the Catalogue of the Reports Submitted by Government Officials Who Have Travelled Abroad, published by the National Archives are included in the Index to the Information Materials Related to Government Administration, published by the National Archives. The publication of the former is hardly justified. (G) The contents of the Index to Legal Literature published by the Seoul National University Libraries and those of the Law Section of the Index to Scholastic Works published by the National Central Library are nearly identical. One of the two indexes should cease to be published. (H) Though five indexes are being published in the field of political science and four in the field of public administration, their subject coverage is limited. Naturally, these indexes are little usable to many other researchers in the two fields. A comprehensive index covering all the specialised areas in each field needs to be developed on one or all the existing indexes. (I) It is suggested that the Catalogue of the Scholastic Works on Curricula published by the National Central Library expands its subject coverage to become a more usable and effective index to all the researchers in the field of education. (J) The bimonthly Index to Periodical Articles and the specialised index by subject series published by the National Assembly Library, and the Index to Scholastic Works published by the National Central Library are expected to increase their coverage and frequency of publication to be used more effectively and more efficiently by all users in all fields till the indexing bulletins suggested in this study will fully be available in Korea.

  • PDF

경기 북부 지역 초등학교 영양사의 영양 교육 실시 현황 (Nutrition Education Performance of Elementary School Dietitians in North Gyeonggi Province)

  • 민경찬;박영심;박혜원;이명호;신용칠;조규봉;이경익;정광옥;신임숙;윤희선
    • 한국식품영양학회지
    • /
    • 제19권2호
    • /
    • pp.183-192
    • /
    • 2006
  • The purpose of this study was to investigate the performance of elementary school dietitians in terms of nutrition education in the northern portion of Gyeonggi province. Self-administered questionnaires were given to 50 dietitians who have worked in elementary schools with self-operation food service, and 35(70%) dietitians returned the questionnaires. The results are summarized as follows: no students took part in nutrition education as a regular course, but all dietitians performed nutrition education in passive ways, such as 'using home correspondence'(39.0%), 'bulletin board/poster'(22.0%), 'using the internet'(13.4%) and 'indirectly through a classroom teacher'(12.2%). Most respondents performed nutrition education 'one time/month'(66.0%) or 'one time/week'(20.0%). The respondents thought that suitable teaching times for nutrition education were 'during a related subject'(35.5%), 'during lunch time'(22.6%) rather than 'during an independent subject'(16.1%). Most of the dietitians(94.3%) did not perform nutrition counseling because of 'a lack of opportunity'(72.7%) and 'workload'(27.3%). Additionally 88.6% of respondents did not have the time of for nutrition counseling for parents because 'am not a teacher'(56.7%) and 'workload'(30,0%). Information sources for nutrition education were mainly 'internet'(71.4%) and 're-educationa1 materials'(17.1%). They possessed instructional materials in the forms of 'printed materials'(35.1 %), 'exhibition/bulletin board'(31.2%), and 'electrical materials'(33.8%), 'but did not have 'solid materials' such as food models and dolls. Generally they had mostly 'leaflets'(82.9%), 'bulletins'(68.6%), 'internet'(57.1%), and 'CDs'(57.1%). Preferences for instructional materials used were 'printed materials'(46.2%), 'exhibition/bulletin board'(36.5%), and 'electrical materials'(17.3%) 'Leaflets'(80.0%) were mainly used; 'CD'(17.1 %) use was low compared to the proportion possessing CDs. The topics frequently chosen by the subjects for nutrition education were 'table manners'(82.9%), 'basic concepts of food and nutrition'(80.0%), and 'proper food habits'(80.0%), but the topics helpful for practical use, such as 'how much do I eat'(20.0%) and 'nutrition labeling'(37.1%), were not included frequently. The respondents thought that 'eating only what they like'(60.0 %), 'intake of processed foods'(17.8%), and 'obesity'(17.8%) were the most common nutritional problems among elementary school children. They also thought that establishing a regular course for nutrition education was an effective way to cut down on these nutritional problems. In conclusion, nutrition education programs that are combined with effective instructional materials and practical topics should be developed. Additionally, it is recommended that dietitians act as teachers who participate in regular courses as soon as possible.

Simultaneous Characterization of Sofalcone and Its Metabolite in Human Plasma by Liquid Chromatography -Tandem Mass Spectrometry

  • Han, Sang-Beom;Jang, Moon-Sun;Lee, Hee-Joo;Lee, Ye-Rie;Yu, Chong-Woo;Lee, Kyung-Ryul;Kim, Ho-Hyun
    • Bulletin of the Korean Chemical Society
    • /
    • 제26권5호
    • /
    • pp.729-734
    • /
    • 2005
  • A sensitive and selective method for quantitation of sofalcone and its active metabolite in human plasma has been established using liquid chromatography-electrospray ionization tandem mass spectrometry (LC-ESI/MS/MS). Plasma samples were transferred into 96-well plate using an automated sample handling system and spiked with 10 $\mu$L of 2 $\mu$g/mL $d_3$-sofalcone and $d_3$-sofalcone metabolite solutions (internal standard), respectively. After adding 0.5 mL of acetonitrile to the 96-well plate, the plasma samples were then vortexed for 30 sec. After centrifugation, the supernatant was transferred into another 96-well plate and completely evaporated at 40 ${^{\circ}C}$ under a stream of nitrogen. Dry residues were reconstituted with mobile phase and were injected into a $C_{18}$ reversed-phase column. The limit of quantitation of sofalcone and its metabolite was 2 ng/mL, using a sample volume of 0.2 mL for analysis. The reproducibility of the method was evaluated by analyzing 10 replicates over the concentration range of 2 ng/mL to 1000 ng/mL. The validation experiments of the method have shown that the assay has good precision and accuracy. Sofalcone and its metabolite produced a protonated precursor ion ([M+H]$^+$) of m/z 451 and 453, and a corresponding product ion of m/z 315 and 317, respectively. Internal standard ($d_3$-sofalcone and $d_3$-sofalcone metabolite) produced a protonated precursor ion ([M+H]$^+$) of m/z 454 and 456 and a corresponding product ion of m/z 315 and 317, respectively. The method has been successfully applied to a pharmacokinetic study of sofalcone and its active metabolite in human plasma.

인터넷 게시판 질문 분류를 위한 인터랙티브 접근방법에 관한 연구 (An Interactive Approach to Categorize Questions on the Internet BBSs)

  • Jae-Kwang Lee;Seong-Ho Noh;Ok-Hyun Ryou
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.177-195
    • /
    • 2003
  • 전통적인 고객지원방법에서는 콜 센터와 서비스 센터가 고객의 질문과 요구 사항을 접수하고 응대하는 기능을 담당해왔다. 최근 인터넷의 급속한 확산에 따라 전화, 우편, 방문 등의 전통적인 고객과의 의사소통수단이 전자우편과 인터넷 게시판과 같은 웹기반의 고객지원시스템으로 전환되고 있다. 인터넷 게시판은 기본적으로 고객의 질문에 관리자가 응답하는 시스템이므로 고객이 응답을 받는데 시간이 걸리는 제약이 있다. 이러한 시간적 제약을 해결하기 위하여 고객이 인터넷을 통하여 고객지원시스템에 접속하여 미리 구축된 지식 데이터베이스로부터 원격에서 질문에 대한 응답을 받을 수 있도록 공통적인 질문과 응답을 FAQ와 같은 형태를 제공한다. 그리고, 인터넷 게시판에 다양한 내용과 형태의 질문이 혼재되어 사용됨으로써 응답과 관리상의 어려움이 많다. 따라서 질문들을 체계적으로 분류하여 FAQ를 만들고, 인터넷 게시판의 관리작업을 지원하기 위한 도구의 필요성이 대두되고 있다. 본 연구에서는 키워드와 키워드들간의 친밀도를 이용하여 벡터형태로 표현한 질문들간의 유사 도를 계산하여 질문들을 클러스터링 하는 방법을 제안한다. 제안한 방법은 기본적으로 자동으로 질문들을 분류하지만, 내용이 애매모호한 질문의 경우 사용자가 상호작용을 통하여 사용자의 판단을 받아들일 수 있도록 개발되었다. 그리고, 제안한 방법의 성능을 평가하기 위하여 프로토타입 시스템을 개발하고 제한된 상황하에서 실험을 수행하였다.

  • PDF

민원 분석을 위한 텍스트 마이닝 기법 연구: 계층적 연관성 분석 (A Study on Text Mining Methods to Analyze Civil Complaints: Structured Association Analysis)

  • 김현종;이태헌;유승의;김나랑
    • 한국산업정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.13-24
    • /
    • 2018
  • 정부 및 공공기관에 있어 시민의 직접적인 요구사항이 담겨 있는 민원은 정책 개발을 위한 중요한 데이터로 활용이 가능하다. 그러나 민원 데이터는 비정형 텍스트로 작성되어 있는 특성으로 인해 일반적인 텍스트 마이닝 기법으로는 시민의 요구사항을 정확히 도출하기 어려웠다. 이에 본 연구에서는 민원 데이터 분석을 위한 텍스트 마이닝 기법을 개선하여, 시민의 요구사항을 도출할 수 있는 방법을 제시하고자 하였다. 새로운 텍스트 마이닝 기법은 공기어구조맵의 원리에 착안하여 연관성 분석을 2단계로 실시하여 핵심주제어를 기반으로 1차 연관 단어 와 2차 연관 단어로 구조화하였다. 분석을 위해 2016년 1년간 부산시 민원게시판에 올라온 3004건을 활용하였다. 분석 결과는 빈도수와 핵심주제어를 가지고 연관성 분석만으로는 찾을 수 없었던 민원 상의 문제를 본연구에서 제시한 계층적 연관성 분석을 이용하여 시민의 요구사항을 더욱 정확하게 파악할 수 있었다. 본 연구는 민원 데이터에서 시민의 요구사항을 도출하기 용이한 방법을 제안하였다는 학문적 기여점이 있으며, 행정기관에서 민원 데이터를 통해 정책 개발에 활용할 수 있다는 실무적 기여점이 있다.

도서관장애인서비스 이용자의 홍보에 대한 인식조사 연구 (A Study of Differently-Abled Users' Perception of Public Relations Services in Libraries)

  • 노영희;안인자;박미영
    • 한국문헌정보학회지
    • /
    • 제45권4호
    • /
    • pp.179-207
    • /
    • 2011
  • 본 연구에서는 도서관장애인서비스 활성화 방안 및 홍보전략 개발의 기초가 될 수 있는 이용자인식조사 연구를 수행하고자 하며, 이를 통해서 이용자에게 가장 적절한 홍보방안을 도출하는데 기여하고자 설문조사 연구를 수행하였다. 연구결과 첫째, 국내 장애인이용자의 도서관서비스에 대한 홍보경험은 32.4%로 매우 낮게 나타났으며, 특히 지적장애인의 경우 전원이 홍보경험이 없는 것으로 조사되었다. 둘째, 도서관 홍보매체 경험으로는 인터넷, 도서관게시판, 현수막, ARS 서비스, 인터넷 방송 순으로 나타났으나, 홍보물에 대한 만족도는 평균 이하(3점 이하)로 나타났다. 반면에 홍보물에 대한 관심도는 매우 높게 나타났다. 셋째, 장애인이용자가 가장 많이 이용하는 도서관홈페이지는 학교도서관, 국립중앙도서관, 공공도서관 순으로 나타났으나, 서비스 이용률은 매우 낮게 나타났고, 경험한 자의 만족도도 매우 낮은 것으로 분석되었다. 넷째, 도서관 이용에 있어 장애인이용자가 가장 필요로 하는 것은 장애를 극복할 수 있는 편의시설의 확보 및 제공임을 알 수 있다. 이에 본 연구는 장애인을 위해 도서관에 도달하는 것의 편의성, 도서관에 도착해서 이용하는 시설의 편의성, 자료의 이용 용이성 등을 개선할 것을 제안한다.

대학 학과홈페이지의 평가요소에 대한 상대적 중요도 분석 -부산지역 수험생들의 인식을 중심으로- (Relative Importance and Priority of Evaluation Elements in University Department Homepage Selection Process -with Special Reference to College Prep Students in Busan-)

  • 강경수;이영우;이강혁;이영숙
    • 한국콘텐츠학회논문지
    • /
    • 제15권3호
    • /
    • pp.488-498
    • /
    • 2015
  • 본 연구는 대학 홈페이지의 성공적 관리 및 운영이 대학의 브랜딩 효과를 초래한다는 점에 착목하여 기존의 대학 홈페이지 평가요소들의 문제점을 인식하고 새로운 평가모형을 도출한 후 각 단계별 평가요소에 대한 중요도 및 우선순위를 파악하고자 하였다. 특히 본 연구는 의사결정 방법론 중 계층분석과정(AHP)을 활용함으로써 학과 홈페이지 평가요소에 대한 중요도의 객관성을 높이고자 하였다. 분석결과, 29개의 학과 홈페이지 평가요소 중 모바일 서비스, 교과과정의 구성현황 및 교과목의 설명, 학과특성을 나타내는 전문적인 교육내용, 홈페이지 이용안내 및 사이트맵 접근의 용이성, 학과의 차별화된 교육방식 등의 요소는 비교적 중요도가 높게 나타난 반면, 학과특성에 적합한 슬로건, 학과의 차별화된 이미지 및 아이덴티티, 학과 SNS와의 연동, Q&A게시판 제공, 커뮤니티 활발한 운영, FAQ기능의 제공 등의 항목은 상대적 중요도가 낮게 나타났다. 본 연구는 이상의 연구결과를 바탕으로 대학 학과홈페이지의 성공적 관리 및 운영을 위한 기본적 토대를 제시했을 뿐 아니라, 학과홈페이지의 활성화를 위한 몇 가지 시사점을 제시하였다.

천문 고문헌 특화 인공지능 자동번역 서비스 시스템 개발 연구 - 시스템 요구사항 분석 및 설계 위주 (Study on the development of automatic translation service system for Korean astronomical classics by artificial intelligence - Focused on system analysis and design step)

  • Seo, Yoon Kyung;Kim, Sang Hyuk;Ahn, Young Sook;Choi, Go-Eun;Choi, Young Sil;Baik, Hangi;Sun, Bo Min;Kim, Hyun Jin;Lee, Sahng Woon
    • 천문학회보
    • /
    • 제44권2호
    • /
    • pp.62.2-62.2
    • /
    • 2019
  • 한국의 고천문 자료는 삼국시대 이후 근대 조선까지 다수가 존재하여 세계적으로 드문 기록 문화를 보유하고 있으나, 한문 번역이 많이 이루어지지 않아 학술적 활용이 활발하지 못한 상태이다. 고문헌의 한문 문장 번역은 전문인력의 수작업에 의존하는 만큼 소요 시간이 길기에 투자대비 효율성이 떨어지는 편이다. 이에 최근 여러 분야에서 응용되는 인공지능의 적용을 대안으로 삼을 수 있으며, 초벌 번역 수준일지라도 자동번역기의 개발은 유용한 학술도구가 될 수 있다. 한국천문연구원은 한국정보화진흥원이 주관하는 2019년도 Information and Communication Technology 기반 공공서비스 촉진사업에 한국고전번역원과 공동 참여하여 인공신경망 기계학습이 적용된 고문헌 자동번역모델을 개발하고자 한다. 이 연구는 고천문 도메인에 특화된 인공지능 기계학습 기법으로 자동번역모델을 개발하여 이를 서비스하는 것을 목적으로 한다. 연구 방법은 크게 4가지 개발을 진행하는 것으로 나누어 볼 수 있다. 첫째, 인공지능의 학습 데이터에 해당되는 '코퍼스'를 구축하는 것이다. 이는 고문헌의 한자 원문과 한글 번역문이 쌍을 이루도록 만들어 줌으로써 학습에 최적화한 데이터를 최소 6만 개 이상 추출하는 것이다. 둘째, 추출된 학습 데이터 코퍼스를 다양한 인공지능 기계학습 기법에 적용하여 천문 분야 특수고전 도메인에 특화된 자동번역 모델을 생성하는 것이다. 셋째, 클라우드 기반에서 참여 기관별로 소장한 고문헌을 자동 번역 모델에 기반하여 도메인 특화된 모델로 도출 및 활용할 수 있는 대기관 서비스 플랫폼 구축이다. 넷째, 개발된 자동 번역기의 대국민 개방을 위해 웹과 모바일 메신저를 통해 자동 번역 서비스를 클라우드 기반으로 구축하는 것이다. 이 연구는 시스템 요구사항 분석과 정의를 바탕으로 설계가 진행 또는 일부 완료되어 구현 중에 있다. 추후 이 연구의 성능 평가는 자동번역모델 평가와 응용시스템 시험으로 나누어 진행된다. 자동번역모델은 평가용 테스트셋에 의한 자동 평가와 전문가에 의한 휴먼 평가에 따라 모델의 품질을 수치로 측정할 수 있다. 또한 응용시스템 시험은 소프트웨어 방법론의 개발 단계별 테스트를 적용한다. 이 연구를 통해 고천문 분야가 인공지능 자동번역 확산 플랫폼 시범의 첫 케이스라는 점에서 의의가 있다. 즉, 클라우드 기반으로 시스템을 구축함으로써 상대적으로 적은 초기 비용을 투자하여 활용성이 높은 한문 문장 자동 번역기라는 연구 인프라를 확보하는 첫 적용 학문 분야이다. 향후 이를 활용한 고천문 분야 학술 활동이 더욱 활발해질 것을 기대해 볼 수 있다.

  • PDF

천문 고문헌 특화 인공지능 자동번역 서비스 시스템 개발 연구 - 개발 결과 및 시험 운영 위주 (Study on the development of automatic translation service system for Korean astronomical classics by artificial intelligence - Focused on development results and test operation)

  • Seo, Yoon Kyung;Kim, Sang Hyuk;Ahn, Young Sook;Choi, Go-Eun;Choi, Young Sil;Baik, Hangi;Sun, Bo Min;Kim, Hyun Jin;Choi, Byung Sook;Lee, Sahng Woon;Park, Raejin
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.56.1-56.1
    • /
    • 2020
  • 한국의 고문헌 중에는 다양한 고천문 기록들이 한문 형태로 존재하며, 이를 학술적으로 활용하기 위해서는 전문 번역가 투입에 따른 많은 비용과 시간이 요구된다. 이에 인공신경망 기계학습에 의한 인공지능 번역기를 개발하여 비록 초벌 번역 수준일지라도 문장 형태의 한문을 한글로 자동번역해 주는 학술 도구를 소개하고자 한다. 이 자동번역기는 한국천문연구원이 한국정보화진흥원이 주관하는 2019년도 Information and Communication Technology 기반 공공서비스 촉진사업에 한국고전번역원과 공동 참여하여 개발 완료한 것이다. 이 연구는 고천문 도메인에 특화된 인공지능 기계학습용 데이터인 천문 고전 코퍼스를 구축하여 이를 기반으로 천문 고전 특화 자동번역 모델을 개발하고 번역 서비스하는 것을 목적으로 한다. 이를 위해 구축되는 시스템은 크게 세 가지이다. 첫째, 로그인이 필요 없이 누구나 웹 접속을 통해 사용이 가능한 클라우드 기반의 고문헌 자동번역 대국민서비스 시스템이다. 둘째, 참여 기관별로 구축된 코퍼스와 도메인 특화된 번역 모델의 생성 및 관리할 수 있는 클라우드 기반의 대기관 서비스 플랫폼 구축이다. 셋째, 개발된 자동번역 Applied Programmable Interface를 활용한 한국천문연구원 내 자체 서비스가 가능한 AITHA 시스템이다. 연구 결과로서 먼저 구축된 천문 고전 코퍼스 60,760건에 대한 샘플링 검수 결과는 품질 순도 99.9% 이상이다. 아울러 도출된 천문 고전 특화 번역 모델 총 20개 중 대표 모델에 대한 성능 평가 결과는 기계 번역 텍스트 품질 평가 알고리즘인 Bilingual Evaluation Understudy 평가에서 40.02점이며, 전문가에 의한 휴먼 평가에서 5.0 만점 중 4.05점이다. 이는 당초 연구 목표로 삼았던 초벌 번역 수준에 충분하며, 현재 개발된 시스템들은 자체 시험 운영 중이다. 이 연구는 특수 고문헌에 해당되는 고천문 기록들의 번역 장벽을 낮춰 관련 연구자들의 학술적 접근 및 다양한 연구에 도움을 줄 수 있다는 점에서 의의가 있다. 또한 고천문 분야가 인공지능 자동번역 확산 플랫폼 시범의 첫 케이스로써 추후 타 학문 분야 참여 시 시너지 효과도 기대해 볼 수 있다. 고문헌 자동번역기는 점차 더 많은 학습 데이터와 학습량이 쌓일수록 더 좋은 학술 도구로 진화할 것이다.

  • PDF