• 제목/요약/키워드: 악보 영상

검색결과 24건 처리시간 0.023초

Backpropagation을 이용한 악보인식 (Recognition of Music using Backpropagation Network)

  • 박현준;차의영
    • 한국정보통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.1170-1175
    • /
    • 2007
  • 본 논문에서는 신경회로망 알고리즘 중 하나인 backpropagation network을 이용한 악보인식 기법과 그에 필요한 악보 영상에 대한 전처리 기법을 제안한다. 전처리과정으로 이진화, 기울기 보정, 오선제거 등의 과정을 수행하여 인식에 필요한 음악 기호와 음표를 분리한다. 분리된 음악 기호와 음표들은 backpropagation 알고리즘을 사용하여 구성된 음표 인식 신경망과 비음표 인식 신경망을 통해 각각 음표와 비음표 인식과정을 거친다. 다양한 복잡도를 가진 악보를 대상으로 한 실험 및 분석 결과를 통해 제안한 악보 인식 기법의 정확도를 기술하였다.

악보인식 전처리를 위한 강건한 오선 두께와 간격 추정 방법 (A Robust Staff Line Height and Staff Line Space Estimation for the Preprocessing of Music Score Recognition)

  • 나인섭;김수형;뀌
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.29-37
    • /
    • 2015
  • 이 논문에서는 모바일 기기상에서 카메라기반 악보인식을 위한 오선 두께와 오선 간격을 추정하는 전처리 기술을 제안한다. 캡쳐된 영상은 조명이나, 흐려짐, 저해상도 등의 많은 왜곡으로 인해 인식에 어려움이 있다. 특히 복잡한 배경을 가지고 있는 악보 영상인식의 경우 더욱 그렇다. 악보 기호 인식에서 오선 두께와 오선 간격은 인식에 큰 영향을 끼친다. 이들 정보는 이진화에도 사용되는데, 복잡한 배경을 가지고 있는 경우 일반적인 이진 영상은 오선 두께와 간격을 추정하는데 만족스럽지 못하다. 따라서 우리는 에지영상에서 런-길이 엔코딩 기술을 이용해 오선 두께와 간격 추정하는 강건한 알고리즘을 제안한다. 제안된 방법은 2단계로 구성되어 있다. 첫 번째 단계는 소벨 연산자에 의해 영역별로 에지 영상을 기반으로 오선 두께와 간격을 추정한다. 각 에지 영상의 열은 런-길이 엔코딩 알고리즘에 의해 기술된다. 두 번째 단계는 안정한 경로 알고리즘을 이용한 오선 검출과 오선 위치를 추적하는 적응적 LTH알고리즘을 이용한 오선 제거이다. 실험결과 복잡한 영상의 경우에도 강건함과 높은 인식률을 보였다.

비전 기반 피아노 자동 채보 시스템 (Vision-Based Piano Music Transcription System)

  • 박상욱;박시현;박천수
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.249-253
    • /
    • 2019
  • 현재 상용화된 악보 채보 프로그램은 오디오 정보를 기반으로 채보를 진행한다. 이러한 기존 채보 프로그램은 환경 의존성, 장비 의존성, 시간 지연이라는 단점을 지니고 있다. 본 논문은 기존의 오디오를 이용하여 채보를 방식을 지양하고, 연주 영상을 분석하여 채보를 진행하는 컴퓨터 비전 기반 악보 채보 시스템을 제안한다. 제안하는 악보 채보 시스템은 대중화된 스마트폰 카메라를 활용하여 피아노 연주를 촬영하고, 이를 분석하여 자동으로 전자 악보인 미디파일을 생성하는 방식으로 동작한다. 컴퓨터 실험에서 제안하는 악보 채보 시스템은 95.6%의 정확도로 연주된 음계를 채보하는 것으로 조사되었다.

인쇄 악보의 인식과 병렬 알고리즘에 관한 연구 (A Study of Printed Score Recognition and its Parallel Algorithm)

  • 황영길;김성천
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.959-970
    • /
    • 1994
  • 본 논문에서는 핸디 스캐너를 사용하여 인쇄 악보를 읽어들여서 이를 최종적으로 매쉬 컴퓨터에서 병렬 수행 하도록 한다. 일차적으로 특정 패턴에 따란 분류하고, 지식을 기반으로하여 인식하게 된다. 본 논문에서 제안하는 알고리즘은 전처리 과정을 최소화하고 단순한 연산을 사용한다. 인쇄 악보의 악상 기호 크기는 여러 가지가 허용되도록하며 악상 기호의 종류의 다양성 때문에 모든 기호를 인식하는 것은 어려운 일이므로 우선 사용 빈도수가 높은 몇가지 기호를 인식하도록 한다. 인식된 결과는 미디 표준파일 형식으로 변환하도록 한다. 영상 처리의 고속성이 요구되므로 다중프로세서를 갖는 병렬처리 시스템이 필요하다. 이차원적인 디지털화된 영상은 SIMD 메쉬 컴퓨터 구조에서 처리되기에 적합하므로 이 구조에 대해서 설명하고 n의 프로세서를 갖는 SIMD 메쉬 컴퓨터 구조상에서의 시간복잡도가 0(n)인 병렬 알고리즘을 기술한다.

  • PDF

부분적 템플릿 매칭을 활용한 악보인식 (Music Recognition by Partial Template Matching)

  • 유재명;김기홍;이귀상
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.85-93
    • /
    • 2008
  • 악보인식기술에는 형상 매칭 방법, 통계적인 방법, 신경망을 이용한 방법, 구조적 방법 등이 있다. 본 논문에서는 핸드폰의 디지털 카메라로 얻은 저해상도 이미지를 인식하는 기술에 대해 접근한다. 이러한 저해상도 이미지에는 많은 왜곡이 포함되어 있어 기존 기술을 활용할 때 많은 문제점들을 나타난다. 문제점은 입력영상이 저해상도이며 조명 등의 촬영 상태가 좋지 않는 점이며, 인식 이전 단계 과정에서 음표 부분에 손실과 약간의 변형이 생긴다는 것이다. 이들 인식 방법들의 일반적인 흐름은 먼저, 디지털이미지를 확보하기 위해 카메라 기능을 이용하여 획득한다. 그런 후에 이진화, 오선 제거, 객체영역 분리가 이루어진 후 인식과정을 통해 악보 인식이 이루어진다. 본 연구에서는 특히 핸드폰이라는 제한적인 상황에서 탑재된 카메라를 통해 획득된 이미지를 대상으로 이러한 문제점을 극복하기 위한 인식 기술을 연구하였다. 먼저, 음표를 머리, 대, 꼬리 부분으로 분리하였다. 그리고 음표의 머리 부분에 템플릿을 적용하였고, 나머지 부분에는 패턴을 적용하여 단일 음표로 이루어진 악보에 대해서 100% 가까운 인식률을 얻을 수 있었다.

타브 숫자 인식을 위한 기계 학습 알고리즘의 성능 비교 (Performance Comparison of Machine Learning Algorithms for TAB Digit Recognition)

  • 허재혁;이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.19-26
    • /
    • 2019
  • 본 논문에서는 기타 타브 악보에서 추출한 프렛 번호를 대상으로 학습 알고리즘의 분류 성능을 비교한다. 타브 악보로부터 세그먼트를 통해 추출된 타브 숫자 데이터는 타브 선과 악보 기호가 포함하기 때문에 레이블링 기법과 비선형 필터를 이용하여 프렛 숫자를 추출한다. 추가적인 데이터 확보를 위해 전처리가 수행된 데이터에 대해 4 방향으로 이동 연산을 수행한다. 선택된 학습 모델은 베이지안 분류기, 지지벡터기기, 프로토타입 기반 학습, 다층 신경망 그리고 합성곱 신경망 모델 등이다. 실험 결과 베이지안 분류기는 85.0% 평균 정확도를 보였고 나머지 분류기는 99.0% 이상의 평균 정확도를 보였다. 일반화 성능과 전처리 단계를 고려 시 합성곱 신경망이 다른 학습 모델들보다 우수하다.

1 인 미디어 창작자를 위한 딥러닝 기반 작곡 어플리케이션 (Music Composition Application with Deep Learning for content creators)

  • 김보경;윤소지;이승희;임예진;유견아;임성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1148-1151
    • /
    • 2021
  • 1 인 미디어 산업의 성장으로 다양한 콘텐츠 제작의 증가와 함께 영상의 분위기를 좌우하는 BGM 의 수요도 급증하고 있다. 그러나 무료 음원은 한정되어 있으며 이미 많은 영상에 쓰여 시청자에게 흔한 느낌을 준다. 특히 MCN 에 소속되지 않은 콘텐츠 크리에이터들은 개성 있고 영상에 어울리는 음원 확보에 어려움을 겪고 있다. 본 연구는 이러한 콘텐츠 제작 환경을 개선하기 위해 창작자가 직접 녹음하거나 악보를 스캔해 자신만의 음원을 제작할 수 있는 웹 애플리케이션 '플랫'을 제안한다. 본 연구를 통해 콘텐츠 크리에이터들은 독창적이고 풍성한 콘텐츠를 만들 수 있으며, 음악적 숙련도와 관계없이 쉽게 음원을 만들 수 있어 작곡에 대한 접근성이 좋아질 것으로 보인다. 또한, 딥러닝을 활용해 음악을 창작함으로써 인공지능 작곡 분야를 활성화하고 디지털 음악 시장의 새로운 분야를 개척하는 데 이바지할 것으로 기대한다.

OpenCV와 Android를 이용한 피아노 연습 어플리케이션 프로젝트 (Piano practice using OpenCV and the Android application project)

  • 이세훈;안효명
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.267-268
    • /
    • 2012
  • 본 논문에서는 Google사의 Project glass를 이용한 피아노 연습 어플리케이션을 제안한다. 하지만 아직 이 기기는 발매되지 않았기 때문에 안드로이드 모바일에서 제작중이다. 사용자악보를 database로 간단하게 관리하고, OpenCV라이브러리를 통해 실제 피아노의 위치와 건반을 인식하고, 손가락의 위치 파악과 소리 인식을 통하여 서로 인식한 정보의 일치여부를 확인한다. 그리고 증강현실 기술을 이용하여 게임적인 요소를 추가시켜서 보다 쉽고, 재미있게 실제 피아노 연습을 할 수 있다. 본 논문에서는 기존에 피아노 연주 연습하는 방식에서 IT기술을 접목시켜서, 교육과 기술발전에 기여할 수 있음을 보인다. 그리고 앞으로 영상처리 기술이 널리 사용될 것으로 예상되어 미리 기술을 학습하는 효과도 있다.

  • PDF

피아노 학습을 위한 IoT 훈련시스템 구현 (Implementation of IoT training system for piano practicing)

  • 유성룡;유강은;김다영;박형근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.526-528
    • /
    • 2022
  • 본 연구에서는 피아노 학습에 있어서 문제점을 도출하고 캡스톤디자인 프로젝트를 통해 피아노를 혼자 학습할 수 있도록 지원하는 IoT기술 기반의 훈련시스템을 개발하였다. 피아노 훈련 매체는 악보를 영상처리기술을 통해 인식하고 훈련시 피아노 음으로부터 FFT 변환을 통해 정확한 건반을 쳤는지를 확인하게 된다. 리듬게임의 요소를 이용하여 시각적 효과 및 점수 표시 기능을 제공함으로써 입문단계에서 지루한 피아노 교육에 대한 흥미를 유발하고 피아노 학습의 효과를 높일 수 있었다.

  • PDF

클로드 드뷔시의 <잊혀진 영상>에 관한 분석 연구 (An Analytical Study of Claude Debussy's )

  • 김희정
    • 문화기술의 융합
    • /
    • 제8권3호
    • /
    • pp.43-50
    • /
    • 2022
  • <잊혀진 영상>은 클로드 드뷔시(Claude Debussy)의 피아노 독주곡으로서 1894년에 작곡되었으나 미상의 이유로 1977년이 되어서야 비로소 출판되었다. 흥미롭게도 총 세 곡으로 구성된 작품 중 제 2곡은 1896년 2월 파리의 일간지 '르 그랑 저널(Le Grand Journal)'을 통해 독립적으로 발표되었으나, 제 1곡과 3곡은 자필 악보 상태로 남아 있다가 1977년 뒤늦게 출판되었다. 이러한 이유로 본 작품은 아직까지도 피아노 연주가들과 음악 애호가들에게 잘 알려지지 않은 작품으로 남아있다. 이에 본 논문에서는 이러한 작품의 출판 시기, 작곡 배경에 대해 먼저 고찰해보고, 작품의 작곡 양식적 특징을 선율, 화성, 형식의 측면에서 면밀하게 분석하여 본다. 본 작품을 구성하는 세 곡은 다양한 교회 선법, 온음음계 그리고 전통적 조성 체계의 회피를 통한 화성적 어법의 확대를 보여주며 드뷔시가 피아노 독주곡에 즐겨 적용하였던 3악장 구성의 틀을 제시한 최초의 작품으로 볼 수 있다. 이러한 드뷔시 피아노 독주곡 양식에 대한 음악어법상의 이해와 함께, 잘 알려지지 않은 본 곡이 차지하는 음악사적인 가치에 대한 관심이 증대될 것을 기대한다.