• Title/Summary/Keyword: 장르변환

Search Result 23, Processing Time 0.023 seconds

Extraction of Temporal and Spectral Features based on Spikegram for Music Genre Classification (음악 장르 분류를 위한 스파이크그램 기반의 시간 및 주파수 특성 추출 기술)

  • Jang, Won;Cho, Hyo-Jin;Shin, Seong-Hyeon;Park, Hochong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.06a
    • /
    • pp.49-50
    • /
    • 2018
  • 본 논문에서는 음악 장르 분류를 위한 시간 및 주파수 기반 스파이크그램 특성 추출 기술을 제안한다. 기존의 음악 장르 분류 시스템에서는 푸리에 변환 기반의 입력 특성을 주로 사용해 왔다. 푸리에 변환은 시간 축에서 프레임 단위로 평균적인 주파수 정보를 취하므로 낮은 시간 해상도를 갖지만, 스파이크그램은 샘플 단위의 주파수 정보를 갖고 있어 고해상도의 특성을 추출할 수 있다. 제안하는 기술은 이러한 시간 기반 특성을 추출하여 주파수 기반 특성 및 SNR 특성과 함께 심층 신경망의 입력으로 사용한다. 제안하는 특성을 사용하여 시간 기반 특성을 사용하지 않은 기존 스파이크그램 특성 기반 분류기의 성능을 개선하였으며, 다른 특성 및 분류기에 비해 적은 수의 특성 입력으로도 우수한 성능을 얻는 것을 확인하였다.

  • PDF

A Study of metamorphosis in Contemporary Metal-craft (현대 금속공예에서의 형질변환에 관한 연구)

  • 임옥수
    • Archives of design research
    • /
    • v.13 no.4
    • /
    • pp.43-56
    • /
    • 2000
  • The purpose of this thesis is to investigate about the various metamorphosis methodology, which is one of the specific skill being used widely in contemporary metal-craft. Even though this methodology is being investigated actively in the other genre, it is not easy to find the example and various experimentation for further expression than in metal craft. The metamorphosis had been dealed little by little before the metal-craft is being modernized. Recentely, the experimentation is more deeply and widely held; because the deconstruction methodology, which is the skill to express the differance in the meaning: material's archetype and dealing with the symbol and metaphorical meanings concealed, is being developed. The special skills of the metamorphosis are Mokumegane, reticulation, Fusing, and electro form Mixed Media metamorphosis; these investigation is being further developed with metal alloy methodology.

  • PDF

집중조명 / DOI(디지털콘텐츠 식별체계)의 도입과 응용시스템의 개발

  • Jeong, Sang-Won
    • Digital Contents
    • /
    • no.9 s.88
    • /
    • pp.62-67
    • /
    • 2000
  • 인터넷을 통해 유통되는 디지털콘텐츠의 식별과 접근을 위한 고유식별체계로서 DOI(Digital Object Identifier)의 개발, DOI의 구문구조, DOI의 관리와 운영, DOI 메타데이터와 장르, DOI변환과 핸들 시스템을 소개하고 DOI의 국내 도입을 위한 DOI등록시스템, 변환시스템 검색시스템, INDECS 메타데이터를 이용한 디지털 콘텐츠 유통관리 시스템, DOI참조링크 시스템의 개념적 설계와 구축 내용을 기술한다.

  • PDF

Adoption of Digital Object Identifier system in Korea (디지털 콘텐츠 식별 시스템(DOI)의 구축)

  • 정상원;오상훈
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.153-156
    • /
    • 2000
  • 인터넷을 통해 유통되는 디지털 콘텐츠의 식별과 접근을 위한 고유 식별체계로서 DOI(Digital Object Identifier)의 개발, DOI의 구문구조 DOI의 관리와 운영, DOI 메타데이터와 장르, DOI변환과 핸들시스템(Handle System)을 소개하고, DOI의 국내 도입을 위한 DOI 등록 시스템, DOI 변환 시스템, DOI 검색시스템 INDECS 메타데이터를 이용한 디지털콘텐츠 유통관리시스템, DOI 참조링크 시스템의 개념적 설계와 구축내용을 기술한다.

  • PDF

Development and Enhancement of Automatic Caption Generation System based on Speech-to-Text for the Hearing Impaired (청각장애인을 위한 음성-자막 자동 변환 시스템 개발 및 음성 인식률 고도화)

  • Choi, Mi-Ae;Kim, Seung-Hyun;Jo, Min-Ae;Park, Dong-young;Kim, Yong-Ho;Yoon, Jong-hoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.465-468
    • /
    • 2020
  • 인터넷 미디어, OTT, VOD 등 신규미디어가 비장애인의 정보제공 매체로 널리 확대되나, 자막 서비스를 제공하지 않아 청각장애인의 정보 격차가 더욱 심화되고 있다. 청각장애인의 미디어 접근성 제고를 위해 음성인식 서버 및 스마트 폰·태블릿 앱 간 연계를 통해 음성을 인식하여 자동으로 자막을 생성하고 표시하는 음성-자막 자동 변환 시스템을 개발하였고 음성인식률을 높이기 위해 뉴스/시사/다큐 장르 영상 콘텐츠의 음성에 대해 학습용 데이터를 제작하여 음성인식 성능을 고도화 시켰다. 본 논문에서는 청각장애인을 위한 음성-자막 자동 변환시스템 구성과 음성인식률 비교 평가 결과를 보여준다.

  • PDF

Strategies and difficulties of making Jeokbyeok-ga into Changguk (<적벽가> 창극화의 전략과 한계)

  • Lee, Jin-Joo
    • (The) Research of the performance art and culture
    • /
    • no.39
    • /
    • pp.31-67
    • /
    • 2019
  • This thesis examines the difficulties of utilizing the narrative and music of Pansori: 판소리 in Changguk: 창극. For this examination, I consider that the reason for the difficulty of making Changguk is the difference between Pansori and Changguk as the genres. Most of the Changguk based on the traditional five Pansori works perform the narration and songs of Pansori literally. However, the original narrative of Pansori has a distinctive dual structure since the formation of its first and second half is created separately. As the drama genre visualizes the story and emphasizes the consistency of action, unlike Pansori, the duality of the original narrative can be seen as the inconsistency of the action. In addition, since the sounds of the original Pansori are rather explanatory than dramatic even in the climax scenes of Jeokbyeok battlefields, it is difficult to produce dramatic scenes in Changguk. The voices of the military, not in the original works, play important roles in revealing the hidden theme effectively in Changguk. However It is impossible to relocate the original text of Pansori into Changguk, as even the voices of the military lack verisimilitude in terms of narrative. Changguk can only be developed as its own work by actively researching and dismantling Pansori .

Implementation of an Intelligent Audio Graphic Equalizer System (지능형 오디오 그래픽 이퀄라이저 시스템 구현)

  • Lee Kang-Kyu;Cho Youn-Ho;Park Kyu-Sik
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.43 no.3 s.309
    • /
    • pp.76-83
    • /
    • 2006
  • A main objective of audio equalizer is for user to tailor acoustic frequency response to increase sound comfort and example applications of audio equalizer includes large-scale audio system to portable audio such as mobile MP3 player. Up to now, all the audio equalizer requires manual setting to equalize frequency bands to create suitable sound quality for each genre of music. In this paper, we propose an intelligent audio graphic equalizer system that automatically classifies the music genre using music content analysis and then the music sound is boosted with the given frequency gains according to the classified musical genre when playback. In order to reproduce comfort sound, the musical genre is determined based on two-step hierarchical algorithm - coarse-level and fine-level classification. It can prevent annoying sound reproduction due to the sudden change of the equalizer gains at the beginning of the music playback. Each stage of the music classification experiments shows at least 80% of success with complete genre classification and equalizer operation within 2 sec. Simple S/W graphical user interface of 3-band automatic equalizer is implemented using visual C on personal computer.

Faction Contents' Practical Study for Korea Film Production's Variety (한국 영화 제작의 다양성을 위한 팩션 콘텐츠 활용 연구)

  • Han, Dal-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.2
    • /
    • pp.193-202
    • /
    • 2009
  • This dissertation is considerably studied Faction Genre which is embossed as a new image content, and it is figured out practical used works' possibilities for Korea film production's varieties. Faction, a neologism, which is combined by Fiction and Fact, is a boundary as limits. If authentic history is closed to a truth, it is a record history description method. Also, if unauthorized history is closed to a fake, it is a fictitious history description method. In addition, macro history and micro history are respectively connected to social criticism's matter and personal action, and these can make various analyses, depend on a boundary's limits and personal analysis. On the other hand, history film could be remembered to audience merely history film itself without existed history's fact. However, there are Faction Genre's Genre possibility and film's attraction which indirectness experience of historic fact could be experienced through film. For Faction Genre’s developing solution, there are three cognitive switches; audience's interpretation ability about history film through watching perception, linking between the past and the present for audience through communication with history, audience's considerable decision about history first or fiction first as film writer's interpretation. Above all, hopefully filmic pressure can be shown with historical true to audience. Therefore, it would be Korea Faction Genre's attraction and hope.

Personalized Multimedia content adaptation system in Ubiquitous Computing Supported Residential Environment (유비쿼터스 주거 환경에서의 개인화된 컨텐츠 적응 시스템)

  • Choi, Jeong-Hwa;Suh, Dong-Jun;Ryo, Yong-Man
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1325-1330
    • /
    • 2006
  • 유비쿼터스 켬퓨팅 환경에서는 디지털 멀티미디어 컨텐츠를 사용자가 언제 어디서나 컨텐츠를 소비할 수 있도록 다양한 환경에 맞게 능동적으로 적응변환 시켜주는 기술이 필요하다. 본 논문에서는 유비쿼터스 컴퓨팅 환경이 가능하도록 구성된 가정에서 여러 종류의 디스플레이에 색각인 사용자에게 필요한 서비스와 정보를 제공해 주는 시스템을 제안한다. 단순히 세션 정보를 이용하여서 다양한 위치의 디스플레이에 정보를 제공해주는 기능에 '사용자의 취향과 색각 유무에 따라 변형되어진 정보' 를 제공해주게 되는 시스템을 설계하였다. 제안한 시스템은 크게 사람의 위치 정보를 인지하는 센서 입력부, LCD 모니터나 TV 브라운관과 같이 영상 정보를 출력해 줄 수 있는 출력부, 사용자에 대한 세션 정보 관리와 스트리밍 서비스를 제공해주는 서버 부분으로 구성되어 있다. 사용자의 위치에 대한 정보는 유비쿼터스 컴퓨팅 환경으로 구성된 테스트 베드 내부 센서를 통해 각 디스플레이의 해당 서비스 지역에 사용자가 들어가게 되면 사용자를 인지하도록 하였다. 제공되는 영상은 인지된 사용자 정보를 통해, 색각자인 경우, 색각자를 위해서 변환 되어진 영상을 사용하며, 또한 미리 설정되어진 사용자의 취향에 관련되어진 장르로 구성되어진 메뉴를 통해서 제공된다. 제안한 시스템은 가정에서 유비쿼터스 컴퓨팅이 가능하도록 한 구성한 Active Home상에 구현하였다. Active Home에서는 서버에서부터 실시간으로 사용자의 위치 정보를 제공 받으며, 사용자의 색각 유무에 따라 색각자를 위해 변환된 영상 또는 원본 영상을 보여준다. Active Home에서의 실험을 통해, 제안한 시스템은 유비쿼터스 컴퓨터 환경에서 사용자의 취향에 따라 자연스러운 인터렉션과 세션 정보를 Seamless하게 제공해주는 도구로 사용 가능함을 보였다.

  • PDF

Automatic 3D data extraction method of fashion image with mannequin using watershed and U-net (워터쉐드와 U-net을 이용한 마네킹 패션 이미지의 자동 3D 데이터 추출 방법)

  • Youngmin Park
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.3
    • /
    • pp.825-834
    • /
    • 2023
  • The demands of people who purchase fashion products on Internet shopping are gradually increasing, and attempts are being made to provide user-friendly images with 3D contents and web 3D software instead of pictures and videos of products provided. As a reason for this issue, which has emerged as the most important aspect in the fashion web shopping industry, complaints that the product is different when the product is received and the image at the time of purchase has been heightened. As a way to solve this problem, various image processing technologies have been introduced, but there is a limit to the quality of 2D images. In this study, we proposed an automatic conversion technology that converts 2D images into 3D and grafts them to web 3D technology that allows customers to identify products in various locations and reduces the cost and calculation time required for conversion. We developed a system that shoots a mannequin by placing it on a rotating turntable using only 8 cameras. In order to extract only the clothing part from the image taken by this system, markers are removed using U-net, and an algorithm that extracts only the clothing area by identifying the color feature information of the background area and mannequin area is proposed. Using this algorithm, the time taken to extract only the clothes area after taking an image is 2.25 seconds per image, and it takes a total of 144 seconds (2 minutes and 4 seconds) when taking 64 images of one piece of clothing. It can extract 3D objects with very good performance compared to the system.