• Title/Summary/Keyword: 과학기술 데이터

Search Result 2,575, Processing Time 0.049 seconds

Trends in Deep Learning-based Medical Optical Character Recognition (딥러닝 기반의 의료 OCR 기술 동향)

  • Sungyeon Yoon;Arin Choi;Chaewon Kim;Sumin Oh;Seoyoung Sohn;Jiyeon Kim;Hyunhee Lee;Myeongeun Han;Minseo Park
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.2
    • /
    • pp.453-458
    • /
    • 2024
  • Optical Character Recognition is the technology that recognizes text in images and converts them into digital format. Deep learning-based OCR is being used in many industries with large quantities of recorded data due to its high recognition performance. To improve medical services, deep learning-based OCR was actively introduced by the medical industry. In this paper, we discussed trends in OCR engines and medical OCR and provided a roadmap for development of medical OCR. By using natural language processing on detected text data, current medical OCR has improved its recognition performance. However, there are limits to the recognition performance, especially for non-standard handwriting and modified text. To develop advanced medical OCR, databaseization of medical data, image pre-processing, and natural language processing are necessary.

Ship Type Prediction using Random Forest with Limited Ship Information (제한적 선박 정보와 무작위의 숲 분류기를 이용한 선종 예측)

  • Ho-Kun Jeon;Jae Rim Han
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.106-107
    • /
    • 2022
  • The ship type identification of the surrounding ship is important information for navigators and VTS officers since they can estimate the maneuverability and near-future route of the ships. However, it is more than frequent that the information is not provided due to transmission trouble and seafarers' unfamiliarity with AIS. Thus, this study suggests predicting ship types through the Random Forest classifier after preparing a training and test dataset that contains ship features and types. The AIS data for Ulsan coast in 2018 was used for this study. The method may provide the effect that many navigators and VTS officers discuss and share the experience of predicting ship types.

  • PDF

Design of Metadata Schema for Biology & Bioinformatics Open Archiving Community (생명과학 Open Archiving Community를 위한 메타데이터 스키마 설계)

  • Ahn Bu-young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.64-66
    • /
    • 2005
  • 한국과학기술정보원(KISTI) 바이오인포매틱스센터(CCBB)에서는 생명과학 관련 주제별 Open Archiving Community의 구성과 운영을 통한 연구자들 간의 정보교환을 유도하고, 더불어 논문뿐만 아니라 세미나, 연구노트 등의 최신의 연구 정보를 공유할 수 있도록 생명과학 Open Archiving Community 시스템을 구축하여 운영하려고 한다. 본 community에서 수집, 구축, 서비스할 점보의 종류는 아티클, 학위논문 연구보고서, 발표자료, 연구노트, 실험데이터, 전자자료 등이다. 그러므로, 전 세계적으로 많이 활용되고 있는 Dublin-core, Marc21, MODS를 비교 분석하여 MODS 메타데이터를 기준으로 아티클과 같은 문헌정보 뿐만 아니라 실험결과, 연구노트 등의 비문헌정보도 유연성 있게 적용할 수 있는 생명과학 관련 주제별 Open Archiving Community를 위한 메타데이터 스키마를 설계하였다.

  • PDF

A Strategy for Research and Development of National Standards (국가표준기술의 연구개발 전략)

  • 윤석기;이병민
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 1999.05a
    • /
    • pp.451-466
    • /
    • 1999
  • 국가표준의 확립과 준수는 수 많은 과학기술 활동과 산업 활동에서 이루어지고 있는 측정의 정밀정확도를 유지하고 데이터의 호환성을 보장함으로써 원활한 경제 사회 활동을 도모하는데 필수적인 역할을 한다. 과학기술은 그 자체가 목표인 동시에 경제사회 발전의 수단이다. 따라서 이러한 측면에서 국가경제에 부합하는 국가표준 연구개발 방향의 설정은 과학기술 발전 전망에서 우리가 역점을 두어야 할 분야를 점검하는 것으로부터 단서를 얻을 수 있다. 미래의 과학기술 전망에 따라 본 연구에서는 국가표준기술이 어떠한 역할을 하며 또한 국민경제에는 어떠한 기여를 하고 있는지 몇 가지 시각에서 도출하여 보고 이러한 기여도를 더욱 확대하기 위한 국가표준의 연구개발 방향과 추진전략을 점검하였다.

  • PDF

A Study on Large-scale Data Analysis based on Hadoop for Astroinformatics (하둡 기반 천문 응용 분야 대규모 데이터 분석 기법 연구)

  • Kwak, Jae-Hyuck;Yoon, Jun-Weon;Jung, Yong-Hwan;Hahm, Jae-Gyoon;Park, Dong-In
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.13-16
    • /
    • 2011
  • 과학 응용 분야에서 생성되는 대규모의 데이터를 빠른 시간 내에 효율적으로 처리해야 할 필요성이 대두 되면서 클라우드 컴퓨팅이 주목받고 있다. 하둡(Hadoop)은 대규모 데이터 처리 분석을 위한 소프트웨어 프레임워크를 제공하는 아파치의 오픈소스 프로젝트로서 클라우드 컴퓨팅의 대표적인 기술로서 널리 사용되고 있다. 특히, 하둡은 높은 확장성과 성능을 제공하면서 결함 탐지와 자동 복구 기능이 우수하여 과학 기술 분야에서도 점차적으로 도입 및 활용되고 있다. 본 논문에서는 하둡을 이용하여 천문 응용 분야에서 생성되는 대규모 데이터를 분석하기 위한 방법을 연구하였다. 본 논문에서 관심을 가지는 천문 응용 데이터는 대략 천만개의 작은 크기의 관측 데이터를 처리해야 하지만, 하둡은 대규모 데이터 처리에 특화되어 있어서 많은 개수의 작은 크기를 가지는 관측데이터 처리에는 적합하지 않다. 본 논문에서는 천문 응용 데이터 처리를 위한 입출력 파일을 하둡에서 제공하는 특수화된 데이터 구조를 이용하여 압축하였고, 천문 응용 실행 코드가 하둡에서 실행이 가능하도록 맵리듀스 작업으로 랩핑하여 구현하였다.

Spatio-Temporal Visualization of Cultural Heritage Collections (문화유산 데이터의 시공간상 시각화 연구)

  • Park, Narae;Jeon, Moongu
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.55-57
    • /
    • 2020
  • 본 연구는 문화유산 데이터의 효과적 정보 시각화 방안을 탐색한다. 문화유산 데이터는 역사적 사회적 맥락 속에서 충실히 이해될 수 있기에, 지리적 평면과 시간 축으로 이루어지는 3차원 시공간 큐브상에 문화유산 데이터들을 배치하는 것은 문화유산의 특성을 반영하면서도 통시적·공시적 조망을 동시에 제공하는 유익한 시각화 방안이 될 수 있다. 이를 확인하기 위해 문화유산 컬렉션 데이터를 지도 평면과 시간 축으로 구성된 시공간 큐브 상에서 탐색·체험할 수 있는 웹 어플리케이션과 AR 어플리케이션을 구현하고, 이에 대한 사용자 평가를 실시했다. 평가 분석 결과 문화유산 데이터의 3차원 시각화는 데이터에 대한 총체적 시야를 제공하고 새로운 체험에 대한 관심과 호기심을 유발하는 한편, 낯선 형식으로 인한 인지적 피로가 뒤따를 수 있어 대상 데이터의 특성, 매체 형식의 특성, 사용자의 경험적 이해, 인간의 지각방식을 고려한 다각적 정보 체험 설계가 필요할 것으로 파악되었다.

  • PDF

과학기술위성 1호의 탑재체 자료 수신을 위한 X-band 대역의 안테나 운용 및 수신 성능 분석

  • 이종주;강경인;신근수;박홍영;김경희;김세일;임종태
    • Bulletin of the Korean Space Science Society
    • /
    • 2004.04a
    • /
    • pp.90-90
    • /
    • 2004
  • 과학기술위성 1호는 2003년 9월 27일 성공적으로 발사된 후 초기 운용 과정을 거친 이후 탑재체의 정상적인 운용에 들어갔다. 과학기술위성 1호에 실린 탑재체는 원자외선 분광기, 우주물리 관측기, 자료수집 시스템 등이 있으며, 탑재체에서 발생된 데이터는 X-band 대역의 RF 시스템인 PDTx를 통해 지상으로 전송된다. 최근의 위성 운용에 의하면 하루 평균 수신량은 원자외선 분광기와 우주 물리 관측기의 자료가 약50Mbyte이며, 수신된 자료는 탑재체팀의 서버로 전송되어 사용자가 데이터를 처리할 수 있도록 되어 있다. (중략)

  • PDF

Flood monitoring and prediction using online unstructured data (비정형데이터를 활용한 홍수 모니터링 및 예측)

  • Lee, Jeong Ha;Hwang, Seok Hwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.118-118
    • /
    • 2019
  • 현재 홍수예보는 정형데이터인 유량 및 수위 등을 활용하여 이뤄지고 있다. 하지만 실제 사람들이 체감하는 홍수에 대한 위험도는 홍수예보 발령과는 달라 홍수예보가 이뤄지지 않은 지역에서 인명사고가 발생하기도 한다. 이는 수위 측정이 이뤄지지 않는 소규모 하천이나 사람들의 유동성이 큰 도심지역에서 빈번하게 발생한다. 이를 보완하기 위해서는 사람들의 체감 정도 및 인구의 유동성을 고려한 비정형데이터를 활용해야 한다. 특히 소셜 네트워크 서비스(Social Network Commuinty, SNS)를 사용하는 사람들이 많아지면서 기존에 사용되어 왔던 정형데이터 센서 이외의 데이터를 제공한다. 또한 개개인이 작성하는 글은 실시간으로 활용이 가능하여 인구의 유동성 및 시 공간적 데이터를 얻기에 유용하여 활용성이 매우 높은 비정형데이터이다. 따라서 본 연구에서는 SNS 데이터를 추출하고 이를 분석하여 2018년에 발생했던 강우사상과의 패턴을 비교하여 홍수예보에서의 활용성을 분석하였다. 홍수와 관련한 키워드를 중심으로 시 공간적 정보 및 추출이 가능한 웹 크롤러(Web Crawler) 프로그램을 작성하였으며 이를 토대로 데이터를 수집하였다. 수집한 데이터와 실제 홍수사상을 비교 분석을 한 결과 강우량 및 수위와 해당 지역에 대한 데이터의 양이 유사한 패턴을 보인 것으로 확인되었다. 실시간으로 데이터를 수집하고 이를 분석하여 리드타임을 충분히 확보한다면 홍수예측에 활용 가능할 것이라 생각된다. 본 연구는 한국건설기술연구원 19주요-대4-시드사업인 '커뮤니티 빅데이터 패턴 해석을 통한 수난(水難) 발생 및 규모 예측 기술 개발(20190126-001) '로 수행되었습니다.

  • PDF

KorSciDeBERTa: A Pre-trained Language Model Based on DeBERTa for Korean Science and Technology Domains (KorSciDeBERTa: 한국어 과학기술 분야를 위한 DeBERTa 기반 사전학습 언어모델)

  • Seongchan Kim;Kyung-min Kim;Eunhui Kim;Minho Lee;Seungwoo Lee;Myung-Seok Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.704-706
    • /
    • 2023
  • 이 논문에서는 과학기술분야 특화 한국어 사전학습 언어모델인 KorSciDeBERTa를 소개한다. DeBERTa Base 모델을 기반으로 약 146GB의 한국어 논문, 특허 및 보고서 등을 학습하였으며 모델의 총 파라미터의 수는 180M이다. 논문의 연구분야 분류 태스크로 성능을 평가하여 사전학습모델의 유용성을 평가하였다. 구축된 사전학습 언어모델은 한국어 과학기술 분야의 여러 자연어처리 태스크의 성능향상에 활용될 것으로 기대된다.

  • PDF