• 제목/요약/키워드: WordStart

검색결과 48건 처리시간 0.026초

Intonational Pattern Frequency of Seoul Korean and Its Implication to Word Segmentation

  • Kim, Sa-Hyang
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.21-30
    • /
    • 2008
  • The current study investigated distributional properties of the Korean Accentual Phrase and their implication to word segmentation. The properties examined were the frequency of various AP tonal patterns, the types of tonal patterns that are imposed upon content words, and the average number and temporal location of content words within the AP. A total of 414 sentences from the Read speech corpus and the Radio corpus were used for the data analysis. The results showed that the 84% of the APs contained one content word, and that almost 90% of the content words are located in AP-initial position. When the AP-initial onset was not an aspirated or tense consonant, the most common AP patterns were LH, LHH, and LHLH (78%), and 88% of the multisyllabic content words start with a rising tone in AP-initial position. When the AP-initial onset was an aspirated or tense consonant, the most common AP patterns were HH, HHLH, and HHL (72%), and 74% of the multisyllabic content words start with a level H tone in AP-initial position. The data further showed that 84.1% of APs end with the final H tone. The findings provide valuable information about the prosodic pattern and structure of Korean APs, and account for the results of a previous study which showed that Korean listeners are sensitive to AP-initial rising and AP-final high tones (Kim, 2007). This is in line with other cross-linguistic research which has revealed the correlation between prosodic probability and speech processing strategy.

  • PDF

음성인식을 위한 의사(疑似) N-gram 언어모델에 관한 연구 (A Study on Pseudo N-gram Language Models for Speech Recognition)

  • 오세진;황철준;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.16-23
    • /
    • 2001
  • 본 논문에서는 대어휘 음성인식에서 널리 사용되고 있는 N-gram 언어모델을 중규모 어휘의 음성인식에서도 사용할 수 있는 의사(疑似) N-gram 언어모델을 제안한다. 제안방법은 ARPA 표준형식 N-gram 언어모델의 구조를 가지면서 각 단어의 확률을 임의로 부여하는 비교적 간단한 방법으로 1-gram은 모든 단어의 출현확률을 1로 설정하고, 2-gram은 허용할 수 있는 단어시작기호 와 WORD 및 WORD와 단어종료기호 의 접속확률만을 1로 설정하며, 3-gram은 단어 시작기호 와 WORD, 단어종료기호 만의 접속을 허용하며 접속확률을 1로 설정한다. 제안방법의 유효성을 확인하기 위해 사전실험으로서 국어공학센터(KLE) 단어음성에 대해 오프라인으로 평가한 견과, 남성 3인의 452 단어에 대해 평균 97.7%의 단어인식률을 구하였다. 또한 사전실험결과를 바탕으로 1,500단어의 중규모 어휘의 증권명을 대상으로 온라인 인식실험을 수행한 결과, 남성 20명이 발성한 20단어에 대해 평균 92.5%의 단어인식률을 얻어 제안방법의 유효성을 확인하였다.

  • PDF

일반 번역시스탬을 위한 일본어 해석기 설계 (A Design of Japanese Analyzer for Japanese to Korean Translation System)

  • 강석훈;최병욱
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.136-146
    • /
    • 1995
  • In this paper, a Japanese morphological analyzer for Japanese to Korean Machine Translation System is designed. The analyzer reconstructs the Japanese input sentence into word phrases that include grammatical and dictionary informations. Thus we propose the algorithm to separate morphemes and then connect them by reference to a corresponding Korean word phrases. And we define the connector to control Japanese word phrases It is used in controlling the start and the end point of the word phrase in the Japanese sentence which is without a space. The proposed analyzer uses the analysis dictionary to perform more efficient analysis than the existing analyzer. And we can decrease the number of its dictionary searches. Since the analyzer, proposed in this paper, for Japanese to Korean Machine Translation System processes each word phrase in consideration of the corresponding Korean word phrase, it can generate more accurate Korean expressions than the existing one which places great importance on the generation of the entire sentence structure.

  • PDF

Proposed a consulting chatbot service for restaurant start-ups using social media big data

  • Jong-Hyun Park;Yang-Ja Bae;Jun-Ho Park;Ki-Hwan Ryu
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권3호
    • /
    • pp.1-7
    • /
    • 2023
  • Since the first outbreak of COVID-19 in 2019, it has caused a huge blow to the restaurant industry. However, as social distancing was lifted as of April 2022, the restaurant industry gradually recovered, and as a result, interest in restaurant start-ups increased. Therefore, in this paper, big data analysis was conducted by selecting "restaurant start-up" as a key keyword through social media big data analysis using Textom and then conducting word frequency and CONCOR analysis. The collection period of keywords was selected from May 1, 2022 to May 23, 2023, after the lifting of social distancing due to COVID-19, and based on the analysis, the development of a restaurant start-up consulting chatbot service is proposed.

CNN 기반의 국내 스타트업 해외-바이어간 추천시스템 설계 (Designing a Recommendation System between Korean Start-ups and Foreign Buyers based on Convolutional Neural Network)

  • 최정석;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.795-796
    • /
    • 2021
  • 본 논문은 국내 스타트업의 상품-서비스에 적합한 해외 바이어를 찾아 맟춤형으로 추천해주는 시스템을 설계하고자 한다. 추천 알고리즘은 CNN 기반의 Word2Vec과 Doc2Vec 알고리즘을 활용하며, 정확도를 높이기 위해 시각정보를 활용한다. 추천 시스템에 사용되는 데이터는 비정형 데이타인 회사 소개 및 상품/서비스 소개 문장 데이터이며, 제품 사진을 시각정보로 이용한다. 유사도가 높은 순으로 추천하기 위해 문장데이타를 키워드 리스트로 변환하고, Word2vec 모델에 이식시켜 키워드 좌표를 만들어 벡터화한다. 그리고, 문장의 중심점간 거리를 계산해 기업간 유사성 및 연관성을 도출한다. 이를 바탕으로 국내 스타트업의 문장데이타 및 시각정보와 유사도가 높은 순으로 해외바이어를 추천한다.

Suggested social media big data consulting chatbot service for restaurant start-ups

  • Jong-Hyun Park;Jun-Ho Park;Ki-Hwan Ryu
    • International journal of advanced smart convergence
    • /
    • 제12권3호
    • /
    • pp.68-74
    • /
    • 2023
  • The food industry has been hit hard since the first outbreak of COVID-19 in 2019. However, as of April 2022, social distancing has been resolved and the restaurant industry has gradually recovered, interest in restaurant start-ups is increasing. Therefore, in this paper, 'restaurant start-up' was cited as a key keyword through social media big data analysis using TexTom, and word frequency and cone analysis were conducted for big data analysis. The keyword collection period was selected from May 1, 2022, when social distancing due to COVID-19 was lifted, to May 23, 2023, and based on this, a plan to develop chatbot services for restaurant start-ups was proposed. This paper was prepared in consideration of what to consider when starting a restaurant and a chatbot service that allows prospective restaurant founders to receive information more conveniently. Based on these analysis results, we expected to contribute to the process of developing chatbots for prospective restaurant founders in the future

수학 교과서의 덧셈과 뺄셈 문장제와 그에 대한 학생들의 반응 분석 (An Analysis on the Word Problems of the Addition and Subtraction in Mathematics Text Books and its Students' Responses)

  • 이대현
    • 대한수학교육학회지:학교수학
    • /
    • 제11권3호
    • /
    • pp.479-496
    • /
    • 2009
  • 세기(counting)와 같은 일상 경험에서 비롯되는 수와 연산에 관한 비형식적 지식은 이후의 학교 교육에 영향을 주며, 문제에 기술된 행위나 관계 유형에 따른 여러 가지 문장제를 해결할 때 문제해결 전략에도 영향을 준다. 이에 본 연구에서는 덧셈과 뺄셈의 문장제를 15가지 유형으로 구분하여 교과서에 제시된 문장제를 분석하였다. 또한 115명의 초등학교 2학년 학생을 대상으로 각각의 문장제에 대한 풀이 결과를 분석하였다. 교과서를 분석한 결과, 덧셈의 경우에 전체적으로 합병 상황의 문장제가 첨가 상황의 문장제보다 많았다. 또한 뺄셈의 경우에 구잔 상황의 문장제가 구차 상황이나 등화 상황의 문장제보다 많았다. 학생들의 문장제 풀이 결과를 분석한 결과, 덧셈 상황에서는 첨가 상황의 문제와 합병 상황의 문제에서 정답률의 차이가 거의 없는 것으로 나타났다. 그리고 뺄셈 상황에서는 구잔 상황의 문제에서 다른 두 상황의 문제보다 정답률이 높게 나타났다.

  • PDF

3세에서 8세 아동의 용언 발달 연구 (A Study on the Development of Inflected Words of Korean based on the analysis of 3 to 8 year-old Children's speech)

  • 최은아;신지영;김수진
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.89-93
    • /
    • 2003
  • The aim of this paper is to investigate the development of inflected words of Korean based on the analysis of 3 to 8 year-old children's spontaneous speech. For this purpose, the authors transcribe the spontaneous speech of 10 Korean children for each age and classified inflected word. The result of the analysis is as follows : $\circled1$ In the verbs simple words are occupied 62%, derivative words 18% and complex words 20%. In the adjectives simple words are 82%, derivative words 7% and complex words 11%. $\circled2$ The children's getting older, derivative and complex words are increased, in spite of simple words are reduced. $\circled3$ 4 year-old children get to start the ability of word formation and then since the children become 8 year-old, the children complete that ability almost all we think.

  • PDF

윈도우의 영향이 제거된 에너지 파라미터에 관한 연구 (A Study of Energy Parameter without Windowing Influence in Speech Signal)

  • 조태수;신동성;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.277-280
    • /
    • 2001
  • The preprocessing is very important course in speech signal processing. It influence the compression-rate in speech coding and the recognition-rate in speech recognition etc. In this paper, we propose that minimizing window-influence method with pitch period and start points. The proposed method is available for voiced detection and word labeling.

  • PDF

초등학교 2·3학년 학생들의 자연수의 덧셈과 뺄셈에 대한 문제해결 능력 분석 (An Analysis on the Elementary 2nd·3rd Students' Problem Solving Ability in Addition and Subtraction Problems with Natural Numbers)

  • 정소윤;이대현
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제19권2호
    • /
    • pp.127-142
    • /
    • 2016
  • 본 연구에서는 자연수의 덧셈과 뺄셈에서 식으로 된 문제와 의미론적 측면의 유형별 문장제에 대한 학생들의 문제해결 능력을 분석하였다. 이를 위해 초등학교 2학년과 3학년 학생들을 대상으로 본 연구에서 제작한 검사 도구를 활용하여 조사연구를 실시하였다. 연구 결과, 덧셈과 뺄셈식과 문장제 모두에서 결과를 모르는 경우의 정답률이 가장 높았으며, 변화량을 모르는 경우와 처음량을 모르는 경우 순으로 정답률에 차이를 보였다. 덧셈 문장제에서는 결과를 모르는 경우에 합병 상황에서 첨가 상황보다 다소 높은 정답률을 보였으나, 전체적으로는 큰 차이가 없었다. 또 뺄셈 문장제에서는 구잔 유형의 정답률이 구차나 등화 유형의 정답률보다 높았으며, 등화 상황과 구차 상황의 정답률은 큰 차이를 나타내지 않았다.