• 제목/요약/키워드: 파이썬 3

검색결과 43건 처리시간 0.018초

챗GPT를 활용한 기록관리 메타데이터 추출 사례연구 (A Case Study on Metadata Extractionfor Records Management Using ChatGPT)

  • 김민지;강성희;이해영
    • 한국기록관리학회지
    • /
    • 제24권2호
    • /
    • pp.89-112
    • /
    • 2024
  • 기록관리에서 메타데이터는 기록을 구성하는 필수 요소 중 하나로 기록물을 적절하게 관리하고 이해하도록 하는데 매우 중요한 역할을 한다. 기록관리 업무에서 메타데이터 요소들의 자동 부여가 불가능할 경우에는 기록전문가가 메타데이터 값을 직접 입력해야 한다. 이러한 업무의 불편함을 개선하기 위해 본 연구에서는 신기술인 챗GPT를 활용하여 기록관리 메타데이터 요소의 추출 방안을 제시하고자 하였다. 챗GPT 기술을 활용하기 위해 파이썬 프로그램과 랭체인 라이브러리를 이용하여 PDF 문서를 제시하고 질문을 통해 기록물의 메타데이터를 추출해보았고, 챗GPT 온라인 서비스를 통해 여러 건의 PDF 문서를 첨부하여 기록물의 메타데이터 요소를 추출해보았다. 그 결과 챗GPT-3.5 turbo를 사용한 랭체인에서는 보안상으로는 안전한 추출 방법이긴 하나 메타데이터의 정확한 요소를 얻기에는 다소 한계가 있었고, 챗GPT-4 온라인 서비스에서는 보안상 중요 문서를 첨부할 수 없지만 비교적 정확한 결과를 추출하였다. 이를 통해 기록관리에서의 메타데이터 추출을 위한 챗GPT 기술 활용의 가능성을 타진할 수 있었고, 챗GPT 관련 기술의 발달에 따라 좀 더 안전하고 정확한 결과 추출이 가능해질 것이다. 이러한 챗GPT의 장점을 활용함으로써 기록관에서 기록 및 메타데이터의 관리적 측면에서 업무의 효율성 및 생산성을 증대시키는데 도움을 줄 수 있을 것이라 기대한다.

오픈-소스 자료처리 기술개발 소프트웨어(Madagascar)를 이용한 탄성파 현장자료 전산처리 적용성 연구 (A Study on the Field Data Applicability of Seismic Data Processing using Open-source Software (Madagascar))

  • 손우현;김병엽
    • 지구물리와물리탐사
    • /
    • 제21권3호
    • /
    • pp.171-182
    • /
    • 2018
  • 탄성파 처리 기술개발 분야의 오픈-소스 소프트웨어인 Madagascar를 이용하여 신호 대 잡음비가 낮고 속도정보가 불확실한 현장 탄성파 자료에 대해 자료처리를 수행하고, 오픈-소스 소프트웨어의 현장 적용성을 시험하였다. 파이썬(python) 기반의 Madagascar는 방법론적으로는 다차원 자료 분석이 가능하고, 처리 공정의 재현성이 뛰어나 효율적인 자료처리가 가능하다는 장점이 있지만, 다소 복잡한 사용법과 자료 구조 시스템으로 인해 현장 자료에 대한 자료처리 사례는 많지 않다. 본 연구에서는 현장 자료에 대한 Madagascar의 효용성을 확인하기 위해 기본적인 탄성파 자료처리(자료입력, 지형 정보 일치, 진동수-파수 필터, 예측 곱풀기, 속도 분석, 수직 시간차 보정, 겹쌓기, 참반사 보정)를 수행하였다. 테스트를 위해 사용한 현장 자료는 서해 군산분지에서 에어건 음원과 480채널의 스트리머로 취득한 해양 탄성파 탐사자료이며, 각 자료처리 단계마다의 결과를 Landmark사의 상용 소프트웨어인 ProMAX (SeisSpace R5000)을 사용하여 처리한 결과와 비교하였다. 그 결과 데이터 입출력 및 관리, 처리 과정의 재현성 및 자동 속도 분석 측면에서는 Madagascar가 상대적으로 높은 효율성을 보였고, 신호 품질 향상을 위한 전처리 결과는 상용 소프트웨어와 유사함을 확인하였다. 반면에, 심부 지층에 대한 영상화 결과는 상용 소프트웨어로 처리한 결과가 보다 뛰어남을 확인하였다. 이러한 결과는 상용 소프트웨어의 경우 다양한 겹반사 제거 모듈이 적용되었고, 상호 대화식 인터페이스로 인해 보다 정교한 자료처리가 가능하였기 때문이다. 그러나, Madagascar의 경우에도 현재 전 세계에서 많은 연구자들이 다양한 자료처리 알고리듬을 개발하여 지속적으로 공개하고 있기 때문에, 향후 이러한 최신 알고리듬을 적용한다면 상업용 수준의 자료처리가 가능해져 보다 향상된 결과를 도출할 수 있을 것이다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.