• 제목/요약/키워드: Utilizing AI

검색결과 289건 처리시간 0.022초

대형 사전훈련 모델의 파인튜닝을 통한 강건한 한국어 음성인식 모델 구축 (Building robust Korean speech recognition model by fine-tuning large pretrained model)

  • 오창한;김청빈;박기영
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.75-82
    • /
    • 2023
  • 자동 음성 인식(automatic speech recognition, ASR)은 딥러닝 기반 접근 방식으로 혁신되었으며, 그중에서도 자기 지도 학습 방법이 특히 효과적일 수 있음이 입증되고 있다. 본 연구에서는 다국어 ASR 시스템인 OpenAI의 Whisper 모델의 한국어 성능을 향상시키는 것을 목표하여 다국어 음성인식 시스템에서의 비주류 언어의 성능 문제를 개선하고자 한다. Whisper는 대용량 웹 음성 데이터 코퍼스(약 68만 시간)에서 사전 학습되었으며 주요 언어에 대한 강력한 인식 성능을 입증했다. 그러나 훈련 중 주요 언어가 아닌 한국어와 같은 언어를 인식하는 데 어려움을 겪을 수 있다. 우리는 약 1,000시간의 한국어 음성으로 구성된 추가 데이터 세트로 Whisper 모델을 파인튜닝하여 이 문제를 해결한다. 또한 동일한 데이터 세트를 사용하여 전체 훈련된 Transformer 모델을 베이스 라인으로 선정하여 성능을 비교한다. 실험 결과를 통해 Whisper 모델을 파인튜닝하면 문자 오류율(character error rate, CER) 측면에서 한국어 음성 인식 기능이 크게 향상되었음을 확인할 수 있다. 특히 모델 크기가 증가함에 따라 성능이 향상되는 경향을 포착하였다. 그러나 Whisper 모델의 영어 성능은 파인튜닝 후 성능이 저하됨을 확인하여 강력한 다국어 모델을 개발하기 위한 추가 연구의 필요성을 확인할 수 있었다. 추가적으로 우리의 연구는 한국어 음성인식 애플리케이션에 파인튜닝된 Whisper 모델을 활용할 수 있는 가능성을 확인할 수 있다. 향후 연구는 실시간 추론을 위한 다국어 인식과 최적화에 초점을 맞춰 실용적 연구를 이어갈 수 있겠다.

데이터 리터러시 연구 분야의 주경로와 지적구조 분석 (Analyzing the Main Paths and Intellectual Structure of the Data Literacy Research Domain)

  • 이재윤
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.403-428
    • /
    • 2023
  • 이 연구에서는 데이터 리터러시 분야 연구의 발전 경로와 지적구조 및 떠오르는 유망 주제를 파악하고자 하였다. 이를 위해서 Web of Science에서 검색한 데이터 리터러시 관련 논문은 교육학 분야와 문헌정보학 분야 논문이 전체의 60% 가까이를 차지하였다. 우선 인용 네트워크 분석에서는 페이지랭크 알고리즘을 사용해서 인용 영향력이 높은 다양한 주제의 핵심 논문을 파악하였다. 데이터 리터러시 연구의 발전 경로를 파악하기 위해서 기존의 주경로분석법을 적용해보았으나 교육학 분야의 연구 논문만 포함되는 한계가 있었다. 이를 극복할 수 있는 새로운 기법으로 페이지랭크 주경로분석법을 개발한 결과, 교육학 분야와 문헌정보학 분야의 핵심 논문이 모두 포함되는 발전 경로를 파악할 수 있었다. 데이터 리터러시 연구의 지적구조를 분석하기 위해서 키워드 서지결합 분석을 시행하였다. 도출된 키워드 서지결합 네트워크의 세부 구조와 군집 파악을 위해서 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 대군집 2개와 그에 속한 소군집 7개를 파악할 수 있었다. 부상하는 유망 주제를 도출하기 위해서 각 키워드와 군집의 성장지수와 평균출판년도를 측정하였다. 분석 결과 팬데믹 상황과 AI 챗봇의 부상이라는 시대적 배경 하에서 사회정의를 위한 비판적 데이터 리터러시가 고등교육 측면에서 급부상하고 있는 것으로 나타났다. 또한 이 연구에서 연구의 발전경로를 파악하는 수단으로 새롭게 개발한 페이지랭크 주경로분석 기법은 서로 다른 영역에서 병렬적으로 발전하는 둘 이상의 연구흐름을 발견하기에 효과적이었다.

O2 플라즈마 표면 처리 공정 후 라미네이션 공정으로 제작된 흑연 페이스트 기반의 저비용 및 고감도 유연 압력 센서 (Low Cost and High Sensitivity Flexible Pressure Sensor Based on Graphite Paste through Lamination after O2 Plasma Surface Treatment Process)

  • 남현진;강철;이승우;김선우;박세훈
    • 마이크로전자및패키징학회지
    • /
    • 제29권4호
    • /
    • pp.21-27
    • /
    • 2022
  • 저렴한 전도성 흑연을 인쇄전자 공법으로 유연 압력 센서를 개발하였다. 유연 압력 센서는 의료, 게임, AI 등 미래 산업에 활용될 소재로 각광받고 있다. 유연 압력 센서용 인쇄전극을 다양한 전기-기계적 특성을 평가한 결과 최대인장률 20%, 30°의 인장/굽힘, 간이 맥박 시험에서 일정한 저항 변화율을 보였다. 이렇게 검증이 완료된 전극을 시뮬레이션하여 더 적합한 matrix 패턴을 설계하였다. Serpentine 패턴을 활용하여 matrix 패턴 제작과 인캡슐레이션을 동시에 진행할 수 있는 공정을 활용하였다. 인쇄된 흑연 전극의 한쪽 면에 접착력 증가를 위한 O2 플라즈마 표면처리하고, 90°회전시켜, 라미네이션 공정을 통해 2개의 전극을 하나로 제작하였다. 이렇게 제작된 matrix 패턴을 인체의 손목 맥박 위치에 부착하여 실측을 진행한 결과 남녀 상관없이 일정한 저항 변화율을 보였다.

KOMPSAT 정사모자이크 영상으로부터 U-Net 모델을 활용한 농촌위해시설 분류 (Semantic Segmentation of Hazardous Facilities in Rural Area Using U-Net from KOMPSAT Ortho Mosaic Imagery)

  • 공성현;정형섭;이명진;이광재;오관영;장재영
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1693-1705
    • /
    • 2023
  • 국토 면적의 약 90%를 차지하는 농촌은 여러가지 공익적 기능을 수행하는 공간으로서 중요성과 가치가 증가하고 있지만 주거지 인근에 축사, 공장, 태양광패널 등 주민생활에 불편을 미치는 시설들이 무분별하게 들어서면서 농촌 환경과 경관이 훼손되고 주민 삶의 질이 낮아지고 있다. 농촌지역의 무질서한 개발을 방지하고 농촌 공간을 계획적으로 관리하기 위해서는 농촌지역 내 위해시설에 대한 탐지 및 모니터링이 필요하다. 주기적으로 취득 가능하고 전체 지역에 대한 정보를 얻을 수 있는 위성영상을 통해 데이터의 취득이 가능하고, 합성곱 신경망 기법을 통한 영상 기반 딥러닝 기술을 활용하여 효과적인 탐지가 가능하다. 따라서 본 연구에서는 의미적 분할(Semantic segmentation)에서 높은 성능을 보이는 U-Net 모델을 이용하여 농촌 지역에서 잠재적으로 위해시설이 될 수 있는 농촌시설을 분류하는 연구를 수행하였다. 본 연구에서는 2020년에 제작된 공간해상도 0.7 m의 KOMPSAT 정사모자이크 광학영상을 한국항공우주연구원으로부터 제공받아 사용하였으며 축사, 공장, 태양광 패널에 대한 AI 학습용 데이터를 직접 제작하여 학습 및 추론을 진행하였다. U-Net을 통해 학습시킨 결과 픽셀 정확도(pixel accuracy)는 0.9739, mean Intersection over Union (mIOU)은 0.7025의 값을 도출하였다. 본 연구 결과는 농촌 지역의 위험 시설물 모니터링에 활용될 수 있으며, 농촌계획 수립에 있어 기초 자료로 활용될 수 있을 것으로 기대된다.

LSTM을 이용한 협동 로봇 동작별 전류 및 진동 데이터 잔차 패턴 기반 기어 결함진단 (Gear Fault Diagnosis Based on Residual Patterns of Current and Vibration Data by Collaborative Robot's Motions Using LSTM)

  • 백지훈;유동연;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.445-454
    • /
    • 2023
  • 최근에는 협동 로봇의 데이터를 활용한 다양한 결함진단 연구가 수행되고 있다. 협동 로봇의 결함진단을 수행하는 기존 연구들은 기존 연구의 학습 데이터는 미리 정의된 기기의 동작을 가정하고 수집한 정적 데이터를 사용한다. 따라서 결함진단 모델은 학습한 데이터 패턴에 대한 의존성이 높아지는 한계가 있다. 또한 단일 모터를 사용한 실험으로 다관절이 동작하는 협동 로봇의 특성을 반영한 진단이 이루어지지 못했다는 한계가 있다. 본 논문에서는 앞서 언급한 두 가지 한계점을 해결할 수 있는 LSTM 진단 모델을 제안한다. 제안하는 방법은 단일 축 및 다중 축 작업 환경에서의 진동 및 전류 데이터의 상관분석을 사용하여 정상 대표 패턴을 선정하고, 정상 대표 패턴과의 차이를 통해 잔차 패턴을 생성한다. 생성된 잔차 패턴을 입력으로 축별 기어 마모 진단을 수행할 수 있는 LSTM 모델을 생성한다. 해당 결함진단 모델은 동작별 대표 패턴을 통해 모델의 학습 데이터 패턴에 대한 의존성을 낮출 수 있을 뿐 아니라 다중 축 동작 수행 시 발생하는 결함을 진단할 수 있다. 마지막으로, 내부 및 외부 데이터의 특성을 모두 반영하여 결함진단 성능을 개선한 결과 98.57%의 높은 진단 성능을 보였다.

A Study on the Intelligent Online Judging System Using User-Based Collaborative Filtering

  • Hyun Woo Kim;Hye Jin Yun;Kwihoon Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.273-285
    • /
    • 2024
  • 교육 분야에서 온라인 저지 시스템이 활발하게 활용됨에 따라 학습자 데이터를 활용하는 다양한 연구가 진행되고 있다. 본 연구에서는 학습자 데이터를 활용하여 학습자의 문제 선택을 지원할 수 있는 사용자 기반 협업 필터링 방식의 문제추천 기능을 제안한다. 온라인 저지 시스템에서 학습자의 문제 선택을 위한 지원은 그들의 향후 학습에 영향을 미치므로 교육의 효과성 제고를 위해 필요하다. 이를 위해 학습자의 문제풀이 성향과 유사한 학습자를 식별하고 그들의 문제풀이 이력을 활용한다. 제안 기능은 충북교육연구정보원에서 운영하는 알고리즘과 프로그래밍 관련 온라인 저지 사이트에 구현됐고, 서비스 유용성과 사용 편이성 측면에서 델파이 기법을 통한 전문가 검토를 수행했다. 또한 사이트 사용자 대상 시범 운영에서 바른코드 제출 비율을 분석한 결과 추천문제에 대해 제출한 경우가 전체 제출에 비해 16% 정도 높았고, 추천문제 사용자 대상 설문조사에서 '도움 된다' 응답은 78%였다. 시범 운영에서는 추천문제 선택과 사용자 피드백 관련 설문 응답 비율이 낮았으므로, 향후 연구과제로 제안 기능의 접근성 향상, 사용자 피드백 수집 및 학습자 데이터 분석 다각화 등을 제시했다.

교원창업 생태계에서 결합형 오픈이노베이션을 통한 성장 사례 연구: 핵심역량이론 관점에서 (A Case Study on Growth Through Coupled Process Open Innovation Open Innovation in the Faculty Startup Ecosystem: From the Perspective of Core Competency Theory)

  • 윤창원;박재홍;손영우;김영진;서영호
    • 벤처창업연구
    • /
    • 제19권3호
    • /
    • pp.173-186
    • /
    • 2024
  • 본 논문은 대학에서 결합형 개방형 혁신을 통해 교원 창업을 성공적으로 진행한 사례를 핵심역량이론관점에서 분석해 보았다. 먼저 교원창업의 현 실태를 조망하고, 생성형 AI 기술을 활용한 초실감 3D 가상인간 스타트업인 '오모션(주)'의 사례를 중심으로 서로 다른 전공의 결합형 개방형 혁신의 효과를 탐구하였다. 연구 방법으로는 오모션(주)의 공동창업자들과 기술사업화 담당자, 해당 분야의 전문가들을 대상으로 심층 인터뷰를 실시하였고 근거이론에 따라 이를 분석하였다. 분석에 있어, 본 논문은 핵심역량 이론에 적용하여, 다양한 학문 분야의 전문 지식과 기술이 융합되는 과정을 분석하였다. 이를 통해 본 논문에서는 기존의 단일 기술 중심의 연구 분야로 국한된 교원 창업의 한계를 넘어, 융복합을 통한 고도화와 부가가치 창출의 가능성을 탐색하고, 대학 창업 생태계에 실질적 시사점을 제공하여 교육 및 연구라는 대학의 기존 역할을 넘어서는 경제적 가치 창출 역할을 제시하고자 하였다. 두 교원의 연구를 결합하여 새로운 기술과 비즈니스 모델을 창출하였고, 교원창업으로서 성공적인 결합형 개방형 혁신이 되기 위해서 창업기업은 핵심역량이론 관점에서 (1)기업가적 역량 (2)기술역량 (3)네트워킹 역량을 보유해야 한다는 것을 확인하였다. 본 연구의 시사점은 오모션(주) 사례를 통해 교원 창업의 결합형 오픈이노베이션을 핵심역량이론 관점에서 긍정적인 영향을 미친다는 결과를 도출하였고, 대학에서 창업을 준비하는 구성원을 대상으로 창업의 방향을 제시하였다는 점에 의미를 두고자 한다.

  • PDF

저온 Cu 하이브리드 본딩을 위한 폴리머 본딩 (The Polymer Bonding for Low-temperature Cu Hybrid Bonding )

  • 김지훈;박종경
    • 마이크로전자및패키징학회지
    • /
    • 제31권3호
    • /
    • pp.1-9
    • /
    • 2024
  • 본 논문은 반도체 패키징 기술의 발전에서 Cu/Polymer 하이브리드 본딩 기술의 중요성을 다룬다. 인공지능(AI) 시대의 요구에 부응하여, 반도체 업계는 높은 I/O 수, 저전력, 고열 방출, 다기능성, 소형화를 달성하기 위해 이종 집적 패키징 기술을 탐구하고 있다. 기존의 Cu/SiO2 하이브리드 구조는 1nm 이하의 표면거칠기 달성을 위한 CMP 공정과의 호환성 및 파티클 원인의 접합부 결함 발생 등의 한계점이 존재하지만, Polymer를 사용한 Cu/Polymer 하이브리드 본딩 기술이 이를 극복할 수 있는 대안으로 주목받고 있다. 본 연구는 Cu/Polymer 하이브리드 본딩에 필요한 Polymer의 증착, 패터닝, 그리고 물성 변화를 중점적으로 탐구하며, 이를 통해 Cu/Polymer 하이브리드 본딩 구조가 기존 기술 대비 갖는 장점과 잠재적 응용 가능성을 제시한다. 특히, 낮은 유리전이온도(Tg)를 가진 Polymer의 사용이 가질 수 있는 저온 접합 공정에서의 이점과 높은 열팽창계수로 인한 기계적 특성의 향상에 대해 논의된다. 또한, Polymer의 표면 특성 변화와 플라즈마 처리를 통한 접합 메커니즘의 개선을 다루며, 본 연구는 Cu/Polymer 하이브리드 본딩 기술이 반도체 업계의 고성능, 저전력 소자 개발에 기여할 수 있는 중요한 돌파구가 될 것임을 강조한다.

대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용 (Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity)

  • 이정원;임일
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.267-286
    • /
    • 2023
  • 인공지능 스피커로 대표되는 대화형 에이전트는 사람-컴퓨터 간 대화형이기 때문에 대화 상황에서 오류가 발생하는 경우가 잦다. 에이전트 사용자의 발화 기록에서 인식오류는 사용자의 발화를 제대로 인식하지 못하는 미인식오류 유형과 발화를 인식하여 서비스를 제공하였으나 사용자가 의도한 바와 다르게 인식된 오인식오류 유형으로 나뉜다. 이 중 오인식오류의 경우, 서비스가 제공된 것으로 기록되기 때문에 이에 대한 오류 탐지가 별도로 필요하다. 본 연구에서는 텍스트 마이닝 기법 중에서도 단어와 문서를 벡터로 바꿔주는 단어 임베딩과 문서 임베딩을 이용하여 단순 사용된 단어 기반의 유사도 산출이 아닌 단어의 분리 방식을 다양하게 적용함으로써 연속 발화 쌍의 유사도를 기반으로 새로운 오인식오류 및 신조어 탐지 방법을 탐구하였다. 연구 방법으로는 실제 사용자 발화 기록을 활용하여 오인식오류의 패턴을 모델 학습 및 생성 시 적용하여 탐지 모델을 구현하였다. 그 결과, 오인식오류의 가장 큰 원인인 등록되지 않은 신조어 사용을 탐지할 수 있는 패턴 방식으로 다양한 단어 분리 방식 중 초성 추출 방식이 가장 좋은 결과를 보임을 확인하였다. 본 연구는 크게 두 개의 함의를 가진다. 첫째, 인식오류로 기록되지 않아 탐지가 어려운 오인식오류에 대하여 다양한 방식 별 비교를 통해 최적의 방식을 찾았다. 둘째, 이를 실제 신조어 탐지 적용이 필요한 대화형 에이전트나 음성 인식 서비스에 적용한다면 음성 인식 단계에서부터 발생하는 오류의 패턴도 구체화할 수 있으며, 오류로 분류되지 않더라도 사용자가 원하는 결과에 맞는 서비스가 제공될 수 있음을 보였다.

HEC 소프트웨어 기반 홍수범람지도 엑셀러레이터 개발 (A Development of Flood Mapping Accelerator Based on HEC-softwares)

  • 김종천;황석환;정종호
    • 대한토목학회논문집
    • /
    • 제44권2호
    • /
    • pp.173-182
    • /
    • 2024
  • 최근 홍수예측과 관련한 연구에서 기계학습과 같은 인공지능 기법을 이용한 데이터모형의 활용에 관한 관심이 높다. 데이터모형은 미리 학습된 정보를 활용하기 때문에 모의에 소요되는 시간을 크게 줄일 수 있다는 장점이 있다. 그러나 데이터모형의 사전학습을 위해서는 많은 양의 침수자료가 필요한 데 반하여 적용할 수 있는 실측자료가 부족한 것이 현실이다. 대안으로 매개변수가 검정된 물리모형의 모의 결과를 실측자료와 함께 사전학습자료로 활용하고 있다. 이러한 상황에서 본 연구에서는 하천범람에 의한 침수예측에 데이터모형을 활용하고자 사전학습을 위한 홍수범람지도를 생성하는 엑셀러레이터를 개발하였다. 개발된 엑셀러레이터에서는 HEC-1을 이용한 홍수량 산정, HEC-RAS를 이용한 홍수위 산정, RAS Mapper를 이용한 하천범람 모의 및 침수예상도 출력의 전체 과정을 자동화한다. 이에 따라 사용자는 수백에서 수십만건의 강우시나리오에 대하여 손쉽게 침수예상도 데이터베이스를 구축할 수 있다. 그래픽 편의 인터페이스(GUI)를 포함하여 홍수범람지도 작성에 필요한 다양한 편의기능을 탑재하고 있으며, 전국에 걸쳐서 위치한 26개소의 테스트베드에 적용하여 실무적용성을 검토하였다.