• 제목/요약/키워드: digital text data

검색결과 330건 처리시간 0.023초

자연음 TTS(Text-To-Speech) 엔진 구현 (Implementation of TTS Engine for Natural Voice)

  • 조정호;김태은;임재환
    • 디지털콘텐츠학회 논문지
    • /
    • 제4권2호
    • /
    • pp.233-242
    • /
    • 2003
  • TTS(Text-To-Speech) 시스템은 텍스트 문장을 자연스러운 음성으로 출력하는 시스템이다. 자연스러운 음성을 출력하기 위해서 언어에 대한 전문적 지식을 비롯하여 많은 시간과 노력이 요구된다. 또한 영어의 음운 변환은 음소에 따라 형태소에 따라 의미에 따라 다양한 변환을 가진다. 이를 일괄적으로 처리하기란 매우 힘든 일이다. 이러한 문제들을 해결하기 위하여 모음과 자음의 변화의 규칙을 적용한 시스템을 구현한다. 이 시스템은 문장의 분석을 통해 분류하고 음소 규칙 데이터를 통해 자연스러운 음성을 출력하게 되는 이전 과정을 통해 특수문자나 숫자 등을 정규화하여 처리한다. 이렇게 처리된 문자 데이터를 운율규칙을 통해 최종 출력한다. 그 결과, 40개의 음소 규칙 데이터를 통해 보다. 정확한 음성을 출력할 수 있었으며, 시스템의 효율성도 높였다. 본 논문에서 제시한 시스템은 각종 통신장비와 자동화기기에 적용하여 다양한 분야에 활용될 수 있을 것이다.

  • PDF

수기정보 전자화 기술 기반의 농축산물 생산이력정보 수집 시스템 (A Production Traceability Information Gathering System based on Handwritten Data Digitalization Technology in Agro-livestock Products)

  • 손봉기
    • 한국산학기술학회논문지
    • /
    • 제12권10호
    • /
    • pp.4632-4641
    • /
    • 2011
  • 이 논문에서는 농축산물 이력추적관리제의 성공적 도입 및 확대에 있어 중요한 기반요소인 생산이력정보를 효율적으로 수집할 수 있는 수기정보 전자화 기술 기반의 농축산물 생산이력정보 수집 시스템을 제안한다. 제안 시스템은 디지털펜으로 종이문서 형태의 관리대장 작성만으로 기록 대장과 동일한 디지털이미지를 생성하고, 필기체인식을 통해 기록 내용을 데이터베스화한다. 제안 시스템은 PC, PDA, 터치스크린 등의 정보 수집기기에 비해 이동성, 사용 편이성, 데이터 입력 속도 측면에서 뛰어나고, 열악한 농축산 작업 환경에서 사용하기 적합하기 때문에 전산능력과 시간적 여유가 없는 농가에서 효율적으로 양질의 생산이력정보를 수집할 수 있다. 수기정보 전자화 기술은 가공, 유통, 판매 단계의 종이문서 기반 정보취득 업무에 적용될 수 있으며, RFID/USN 기반 시스템과 연동하여 고도화된 이력추적관리 시스템 구축에 사용될 수 있다.

대용량 텍스트를 위한 손실 없는 영상 은닉기술 (Simple Image Stenography Technology for Large Scale Text)

  • 이근무
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.1104-1107
    • /
    • 2008
  • 이미지 혹은 문서 은닉기술은 문서, 영상, 오디오 등 모든 종류의 디지털 데이터에 대하여 연구가 진행되고 있다. 이들은 다양한 목적과 용도로 이용되고 있다. 본 연구에서는 낮은 수준의 보안을 요하는 텍스트를 대용량으로 은닉하여 전달할 수 있는 단순하고 단순한 기법을 구현하였다. 먼저 텍스트 이미지를 결합하고 이를 24 비트 심도의 칼라이미지에 인코딩하여 복구하였다. 결과는 상관기법을 이용하여 분석하였으며 텍스트 이미지의 손실율이 미미한 것으로 판명되었다.

인과관계문형 기반 사회이슈 발생원인 도출 방법 연구 (A study on the method of deriving the cause of social issues based on causal sentences)

  • 이남연;이재형
    • 디지털융복합연구
    • /
    • 제19권3호
    • /
    • pp.167-176
    • /
    • 2021
  • 최근 빅데이터 분석 기술이 발전하면서 사회 이슈를 분석하기 위해 그 동안 많은 텍스트 마이닝 기법을 활용한 연구들이 진행되어왔다. 사회이슈를 도출하기 위한 기존의 연구들을 살펴보면 다량의 텍스트 데이터를 뉴스, SNS 등으로부터 수집하여 토픽 모델링, 네트워크 분석 등의 기법을 이용하여 데이터로부터 이슈를 추출하고 분석하는 방식으로 연구들이 이루어져왔다. 사회 이슈는 다양한 사회현상들이 누적되어 나타나는 결과물이다. 하지만 기존 연구들이 가지는 한계점은 사회적으로 나타나는 이슈, 즉 결과에 대한 분석에 초점이 맞춰져 있어 해당 이슈의 발생 원인을 밝히는 것에는 한계를 가진다는 것이다. 사회이슈에 적절하게 대응하기 위해서는 어떠한 사회이슈가 존재하는지를 확인하는 것뿐만 아니라 사회이슈의 발생 원인을 파악하는 것이 필요하다. 이러한 한계점을 극복하기 위해서 본 연구에서는 사회 이슈와 관련한 텍스트로부터 사회이슈의 원인이 되는 요인을 도출하는 방법을 국어학의 품사이론을 기반으로 제안하였다. 이를 위해서 2017년 1월부터 2019년 12월까지의 3년 동안의 사회이슈와 관련한 뉴스데이터를 수집하여 수집된 텍스트 내 단어들의 인과관계를 인과문형을 찾아 분석한 후 기존 텍스트마이닝 기법 접목하여 사회이슈의 원인 단어들을 찾는 방법론을 제안하였다.

빅데이터 분석을 이용한 패션 플랫폼과 패션 스마트 팩토리에 대한 인식 연구 (A Study on the Perception of Fashion Platforms and Fashion Smart Factories using Big Data Analysis)

  • 송은영
    • 한국의류산업학회지
    • /
    • 제23권6호
    • /
    • pp.799-809
    • /
    • 2021
  • This study aimed to grasp the perceptions and trends in fashion platforms and fashion smart factories using big data analysis. As a research method, big data analysis, fashion platform, and smart factory were identified through literature and prior studies, and text mining analysis and network analysis were performed after collecting text from the web environment between April 2019 and April 2021. After data purification with Textom, the words of fashion platform (1,0591 pieces) and fashion smart factory (9750 pieces) were used for analysis. Key words were derived, the frequency of appearance was calculated, and the results were visualized in word cloud and N-gram. The top 70 words by frequency of appearance were used to generate a matrix, structural equivalence analysis was performed, and the results were displayed using network visualization and dendrograms. The collected data revealed that smart factory had high social issues, but consumer interest and academic research were insufficient, and the amount and frequency of related words on the fashion platform were both high. As a result of structural equalization analysis, it was found that fashion platforms with strong connectivity between clusters are creating new competitiveness with service platforms that add sharing, manufacturing, and curation functions, and fashion smart factories can expect future value to grow together, according to digital technology innovation and platforms. This study can serve as a foundation for future research topics related to fashion platforms and smart factories.

앙상블 기법을 활용한 온라인 음식 상품 리뷰 감성 분석 (Sentiment analysis of online food product review using ensemble technique)

  • 김한민;박경보
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.115-122
    • /
    • 2019
  • 온라인 마켓에서 소비자는 다양한 상품을 접하고 이에 대한 의견을 자유롭게 기술한다. 소비자의 상품 리뷰가 다른 소비자와 온라인 마켓의 성공에 큰 영향을 주는 만큼 온라인 마켓은 판매 상품에 대한 소비자의 감성을 정확하게 분석할 필요가 있다. 데이터 분석 기법 중 하나인 텍스트 마이닝은 상품에 대한 소비자 리뷰를 분석하여 상품을 효율적으로 관리할 수 있게 해준다. 선행 연구들은 데이터 도메인과 사이즈에 따라 분석 결과의 정확도가 다르게 나타남에도 불구하고 특정 도메인과 2만개 미만의 데이터를 분석해왔다. 또한, 분석의 정확도를 향상 시킬 수 있는 추가 요인에 대한 연구는 거의 수행하지 않았다. 본 연구는 앙상블 기법을 활용하여 기존 연구에서 주로 다루지 않은 음식 상품 도메인의 72,530개 리뷰 데이터를 분석하였다. 또한, 분석 정확도 향상과 관련하여 요약 리뷰의 영향력을 살펴보았다. 연구 결과, 본 연구는 기존 연구와 다르게 부스팅 앙상블 기법이 가장 높은 분석 정확도를 보인다는 사실을 발견하였다. 또한, 요약 리뷰는 분석의 정확도 향상에 기여하는 것으로 나타났다.

텍스트마이닝을 활용한 정보보호 키워드 기반 소셜미디어 빅데이터 분석 (Social Media Bigdata Analysis Based on Information Security Keyword Using Text Mining)

  • 정진명;박영호
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.37-48
    • /
    • 2022
  • 디지털 기술의 발전으로 사회적 이슈들이 SNS와 같은 디지털 기반 플랫폼을 통해서 소통되고 여론을 형성하기도 한다. 본 연구에서는 소셜미디어를 통해서 공유되고 있는 정보보호 이슈관련 여론을 살펴보기 위하여 대표적인 단문 소셜네트워크서비스인 트위터 빅데이터 분석을 진행하였다. 2021년 1년간 14개 정보보호 관련 키워드를 중심으로 데이터를 수집한 후, 데이터마이닝 기술을 활용하여 용어 빈도(TF)분석과 피어슨 계수를 활용한 상관분석을 통해 키워드간의 상관관계를 밝혔다. 또한 잠재적 확률기반 LDA 토픽모델링을 실시하여 정보보호분야에 많은 관심을 받았던 6개의 주요 토픽을 도출하였다. 이러한 결과는 관련 산업의 전략수립이나, 정부 정책수립 시 주요 키워드를 도출하는 기초데이터로 활용될 수 있을 것으로 기대된다.

토픽 모델링 기반의 국내외 공공데이터 연구 동향 비교 분석 (Topic Modeling-Based Domestic and Foreign Public Data Research Trends Comparative Analysis)

  • 박대영;김덕현;김건욱
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.1-12
    • /
    • 2021
  • 최근 4차 산업혁명으로 빅데이터의 성장과 가치는 지속적으로 증가하고 있으며, 정부에서도 공공데이터 개방과 활용에 적극적으로 노력하고 있다. 하지만 여전히 시민들의 공공데이터 활용 요구수준에는 미치지 못하는 상황이며, 현 시점에서 공공데이터 분야의 연구동향 파악과 발전 방향을 모색할 필요가 있다. 이에 본 연구에서는 공공데이터와 관련된 연구 동향을 파악하기 위해서 텍스트 마이닝 기법에서 주로 활용되는 토픽 모델링을 활용하여 분석하였다. 이를 위해 국내외 학술논문 중 '공공데이터', 'Public Data'의 키워드가 포함된 논문(국내 1,437건, 국외 9,607건)을 수집하여 LDA 알고리즘 기반의 토픽 모델링을 수행하였으며, 국내외 공공데이터 연구 동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 공공분야 정책 연구가 주를 이루고 있으며, 국외는 의료, 건강 관련 연구가 높게 나타났다. 토픽별 시계열로 살펴보면 국내는 '개인정보보호', '공공데이터 관리', '도시 환경' 분야의 연구가 증가하였으며, 국외는 '도시정책', '세포 생물학', '딥러닝', '클라우드·보안' 분야 연구가 활성화되고 있음을 확인할 수 있었다.

FPGA를 이용한 JPEG Image Display Board 설계 및 구현 (Design and Implementation of JPEG Image Display Board Using FFGA)

  • 권병헌;서범석
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권3호
    • /
    • pp.169-174
    • /
    • 2005
  • 본 논문은 Verilog HDL로 FPGA에 JPEG Decoder를 구현하여 TV에 JPEG 영상을 디스플레이 하기 위한 JPEG Image Display Board 설계 방법을 제안한다. 본 논문은 FPGA에 Decoder Algorithm을 구현하기 위한 효율적인 방안을 제시하였으며 JPEG Decoder Algorithm은 JPEG Standard Baseline에 기준으로 하여 설계 하였다. 압축된 JPEG bit stream을 저장하기 위하여 Nand Flash Memory를 사용하였으며, JPEG Decoding된 영상을 TV화면에서 확인하기 위하여 Video Encoder를 사용하였다. 또 한 JPEG 영상에 Text data를 쓰기 위하여 YCbCr의 출력 bit를 RGB 24bit로 변환하였다. Video Encoder에 변환된 RGB Data를 동기시켜 출력하기 위하여 CVBS 입력을 Sync Separator에 의해 Hsync, Vsync, Sync, Field signal로 분리하였다. 또한 Display B/D상의 스위치를 통하여 JPEG 모드와 일반영상 모드를 선택할 수 있게 입증하였다.

  • PDF

빅데이터 분석을 통한 데이터 3법 인식에 관한 연구 (A Study on the Perception of Data 3 Act through Big Data Analysis)

  • 오정주;이환수
    • 융합보안논문지
    • /
    • 제21권2호
    • /
    • pp.19-28
    • /
    • 2021
  • 산업의 디지털 전환을 촉진하고 혁신을 가속화하고자 우리나라는 디지털 뉴딜 정책을 추진하고 있다. 그러나 엄격한 기존의 데이터 관련 법제 하에서는 디지털 뉴딜정책을 위한 산업계의 데이터 활용에 여전히 제약이 있는 상황이다. 이러한 문제를 해결하기 위해서 데이터 3법 개정안이 발의되었으나 실제로 산업계의 데이터 이용 활성화에 어떠한 영향을 미칠지에 대한 논의는 아직 부족한 상황이다. 이에 본 연구에서는 데이터 3법에 대한 여론의 인식을 분석하여 데이터 3법 개정안의 시사점을 분석하고자 한다. 이를 위하여 데이터 3법 개정안과 관련 연구동향을 분석하고, 빅데이터 분석 기법을 이용하여 데이터 3법에 대한 인식을 분석하였다. 분석결과에 따르면 데이터 3법은 개정 취지에 부합하게 데이터 산업 활성화를 촉진하는 반면에 특정산업 분야에 치중될 우려가 있는 것으로 나타났다. 본 연구의 결과는 빅데이터 분석을 통해 시행 초기인 데이터 3법의 산업영향에 대한 온라인 인식을 분석함으로써 향후 개선방안에 대한 시사점을 제공한다는 점에서 의의가 있다.