• 제목/요약/키워드: n-gram

검색결과 577건 처리시간 0.024초

반복학습법에 의해 작성한 N-gram 언어모델을 이용한 연속음성인식에 관한 연구 (Continuous Speech Recognition Using N-gram Language Models Constructed by Iterative Learning)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.62-70
    • /
    • 2000
  • 일반적으로 통계적 언어모델의 확률을 추정하는 방법은 대량의 텍스트 데이터로부터 출현빈도가 높은 단어를 선택하여 사용하고 있다. 하지만 특정 태스크에서 적용할 언어모델의 경우 시간적, 비용적 측면을 고려할 때 대용량의 텍스트의 사용은 비효율적일 것이다. 본 논문에서는 특정 태스크에서 사용하기 위해 소량의 텍스트 데이터로부터 효율적인 언어모델을 작성하는 방법을 제안한다. 즉, 언어모델을 작성할 때 출현빈도가 낮은 단어의 빈도를 개선하기 위해 같은 문장을 반복하여 학습에 참가시키므로 단어의 발생확률을 좀 더 강건하게 하였으며 제안된 언어모델을 이용하여 3명이 발성한 항공편 예약관련 200문장에 대하여 연속음성인식 실험을 수행하였다. 인식실험 결과, 반복학습에 의해 작성한 언어모델을 이용한 경우가 반복학습 적용 전에 비하여 평균 20.4%의 인식률 향상을 보였다. 또한 기존의 문맥자유문법을 이용한 시스템과 비교하여 인식률이 평균 13.4% 향상되어 제안한 방법이 시스템에 유효함을 확인하였다.

  • PDF

의사 N-gram 언어모델을 이용한 핵심어 검출 시스템에 관한 연구 (A Study on Keyword Spotting System Using Pseudo N-gram Language Model)

  • 이여송;김주곤;정현열
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.242-247
    • /
    • 2004
  • 일반적인 핵심어 검출 시스템에서는 필러모델과 핵심어모델을 연결단어 인식 네트워크로 구성하여 핵심어 검출에 사용한다. 이것은 대량의 텍스트 데이터를 이용한 대어휘 연속 음성인식에서 구해지는 단어의 출현빈도의 언어모델을 핵심어 검출 시스템에서 효과적으로 구성할 수가 없는 어려움이 있기 때문이다. 이를 해결하기 위하여 본 논문에서는 의사 N-gram 언어모델을 이용한 핵심어 검출 시스템을 제안하고 핵심어와 필러모델의 출현빈도의 변화에 따른 핵심어 검출 성능을 조사하였다. 그 결과, 핵심어와 필러모델의 출현확률을 0.2:0.8의 비율에서 CA (Correctly Accept for Keyword: 핵심어를 제대로 인정한 경우)가 91.1%, CR (Correctly Reject for OOV: 비핵심어에 대해 제대로 거절한 경우)는 91.7%로써, 일반적인 연결단어인식 네트워크를 이용한 방법보다 제안된 방법이 CA-CR 평균 인식률의 에러감소율 (Error Reduction Rate)에서 14%향상되어 핵심어 검출에서의 언어모델 도입의 효과를 확인할 수 있었다.

항균제로서 Pteridine이 치환된 Pyridonecarboxylic Acids의 합성 및 항균 작용에 관한 연구 (Studies on the Synthesis of Pterdine Substituted Pyridonecarboxylic Acids as Potential Antibacterial Agents and their Antimicrobial Activities)

  • 류성렬;주동준
    • 공업화학
    • /
    • 제7권6호
    • /
    • pp.1096-1104
    • /
    • 1996
  • 새로운 항균제 및 항종양제를 합성하기 위하여 norfloxacin(8) 또는 ciprofloxacin(9)이 pteroic acid의 C-9위치에 치환되고 C-2 위치에 아미노기 대신 $CH_3$기가 치환된 새로운 pteroic acid 유도체 13a와 13b를 합성하였다. 이는 출발 물질인 norfloxacin과 ciprofloxacin의 piperazine N-4 위치에 2-amino-3-cyano-5-chloro-methylpyrazine(20)을 결합하여 1-alkyl(ethyl, cyclopropyl)-6-fluoro-1,4-dihydro-4-oxo-7-[[4-N- (2-amino-3-cyanopyrazin-5-yl)methyl]piperazin-1-yl]-3-quinolinecarboxytic acid(12a, 12b)를 합성하였다. 이를 각각 acetamidine. HCl과 고리화시켜 C-2 위치에 아미노기 대신 $CH_3$기가 치환된 새로운 pteroic acid 유도체 135와 13b를 각각 76.2%와 82.8%의 수율로 합성하였다. 그리고 이들 화합물에 대한 항균활성의 측정은 Pseudomonas aeruginosa ATCC9027을 포함하여 Gram-positive와 Gram-negative bacteria에 대하여 검토한 결과 합성한 화합물 13a와 13b는 일반적으로 norfloxacin보다 낮은 항균활성을 나타냈다.

  • PDF

이상탐지 활용 전자집단민원 추정 방법론에 관한 탐색적 연구: 창원시 시민의 소리 사례를 중심으로 (An Exploratory Study of Collective E-Petitions Estimation Methodology Using Anomaly Detection: Focusing on the Voice of Citizens of Changwon City)

  • 정하영
    • 정보화정책
    • /
    • 제26권4호
    • /
    • pp.85-106
    • /
    • 2019
  • 최근 전자민원시스템에 집단민원을 제기하는 사례가 늘어나고 있으나 이에 대한 효율적인 관리시스템이 아직 마련되어 있지 않아 행정 업무량 증대와 사회적 갈등 양산 등의 부작용이 우려되고 있다. 이에 본 연구에서는 이상탐지와 코퍼스 언어학 기반의 내용분석을 활용한 전자 집단민원 추정 방법론을 제시하고자 하였다. 이를 위하여 1)집단민원의 개념에 대한 이론적 고찰과 2) 비모수적 비지도 학습에 기반 한 이상탐지를 활용한 전자 집단민원 추정과 3) n-gram 코사인 각도 거리를 활용한 민원의 내용 유사도 분석방법론을 제안하고 4) 창원시 시민의 소리에 대한 사례분석을 통하여 제시한 방법론의 유용성과 정책적 시사점, 향후 과제를 검토하였다.

빅데이터 분석을 이용한 문단 내의 감정 예측 (Emotion Prediction of Paragraph using Big Data Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.267-273
    • /
    • 2016
  • 모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.

새로운 아미노산 유도체인 N-[(Benzoyl amino)-Thioxomethyl]-Amino Acid(HL)의 착물 합성, 특성규명 및 생물학적 활성 (Synthesis, Characterization and Biological Activity of Some Complexes of Some New Amino Acid Derivatives N-[(Benzoyl amino)-Thioxomethyl]-Amino Acid(HL))

  • Al-Mudhaffar, Dhafir M.H.;Al-Edani, Dawood S.;Dawood, Suma M.
    • 대한화학회지
    • /
    • 제54권5호
    • /
    • pp.506-514
    • /
    • 2010
  • benzoylisothiocyanate 와 아스파르트산 [BATA] (1), 글루탐산 [BATG] (2), 메티오닌 [BATM] (3), 루신 [BATL] (4), 및 트립토판 [BATT] (5) 등의 다양한 아미노산을 반응시켜 일련의 새로운 리간드인 N-[(benzoylamino)-thioxomethyl]-amino acid (HL)를 합성하였다. 이들 리간드의 특성을 원소분석, IR 및 NMR로 규명하였다. 이러한 리간드 (6-8)의 몇가지 전이금속 착물을 제조하여[M = Cu(II), Co(II), 또는 Ni(II)] 원소분석, IR 및 $^1H$ NMR을 통하여 특성을 규명하였다. 항균성에 대한 연구 결과 모든 리간드가 항균 활성을 보이지 않는 반면, ($ML_2$) 착물; [M=Cu(II),Co(II), 또는 Ni(II)]은 (Gram -ive) Escherichia (NCTC5933) 및 (Gram +ive) Staphylococcus (NCTC6571)에 대해 항균 활성을 보였으며 또한 (BALB/C) 알비노 쥐에 대해 독성을 보이지 않았다.

N-gram을 활용한 DGA 기반의 봇넷 탐지 방안 (DGA-based Botnet Detection Technology using N-gram)

  • 정일옥;신덕하;김수철;이록석
    • 융합보안논문지
    • /
    • 제22권5호
    • /
    • pp.145-154
    • /
    • 2022
  • 최근 봇넷의 광범위한 확산과 고도의 정교함은 기업과 사용자뿐만 아니라 국가 간 사이버전에도 심각한 결과를 초래하고 있다. 이 때문에 봇넷을 탐지하고자 하는 연구는 꾸준히 되고 있다. 하지만, DGA 기반의 봇넷은 기존의 시그니처 및 통계 기반의 기술로는 탐지율은 높지만, 오탐율 또한 높은 한계가 있다. 이에 본 논문에서는 DGA 기반의 봇넷을 탐지하고자 문자 기반의 n-gram을 활용한 탐지모델을 제안한다. 제안한 모델을 통해 기존의 탐지 기술의 한계인 탐지율을 높이고 오탐율을 최소화할 수 있다. 다양한 DGA 봇넷에서 사용하는 대규모의 도메인 데이터셋과 정상 도메인에 대한 실험을 통해 기존의 모델보다 성능이 우수함을 확인하였다. 제안된 모델의 오탐율은 2~4% 미만이며 전체 탐지 정확도와 F1 점수는 모두 97.5%임을 확인하였다. 이처럼 본 논문에서 제안한 모델을 통해 DGA 기반의 봇넷에 대한 탐지 및 대응 능력이 향상될 것을 기대한다.

병실 낙하균 및 산모감염에 관한 연구 (A Study on the Air Counts and the Infection of Maternity in n General Hospital)

  • 이남희
    • 대한간호학회지
    • /
    • 제9권2호
    • /
    • pp.17-26
    • /
    • 1979
  • This research is to prevent the infection of maternity in the hospital by examining the microbes contaminations in maternity through airbone microbes and those who are engaged in the ward of O.B. & G.Y. and to furnish the basic data available to hospital management. The bacterial growth of airbone microbes contaminations in nosocomial air and who thor the nasal cavity of passers by (doctors, nurses, parturient women) who went to the ward of O.B. & G.Y. contaminated or not were examined in“E”Univ. Hospital from July to August, 1979 by using thioglycollate broths and agar plates. The following results were obtained: 1. The average colony number of airborne microbes revealed as follows the pediatric ward (36 colonies), the internal ward (33 colonies), the ward of O.B. & G.Y. (30 colonies), the ward of surgery (24 colonies), delivery-waiting room (11 colonies), and the delivery room (3 colonies). 2. The bacterial growth beforenoon differed from that of afternoon. Namely, the latter (24 colonies) was higher than the former (21 colonies). 3. The type of strains isolated from the air of the ward revealed staphylococci (82%), Gram negative bacilli (18%), fungi (17%), Gram positive diplococci (13%), and Bacillus subtilis (2.8%). 4. The strains isolated in the delivery-waiting room revealed staphylococci (66.7%), Gram negative bacilli (33.6%), and revealed staphylococci (75%), Gram positive diplococci (8.3%), and fungi (8.3%), in delivery room. 5. Most of strains isolated in the ward of O.B. & G.Y. revealed staphylococci (100.0%), Gram positive diplococci (8.3%), and Gram negative bacilli (6.7%). 6. The strain isolated in the surgical ward revealed staphylococci (91.7%), fungi (33.3%), Gram positive diplococci (25%), Gram negative bacilli (25%) and Bacillus subtilis (8.3%). 7. The strain isolated in the pediatric ward revealed staphylococci (75%), fungi (25%), Gram positive diplococci (8.3%), Bacillus subtilis (8.3%), and Gram negative bacilli (8.3%). 8. The strain isolated in the internal ward revealed staphylococci (91.7%), fungi (33.3%), Gram positive diplococci (25%), and negative bacilli (16.7%). The strains isolated from the nasal cavity of those doctors and nurses who and enaged in the ward of O.B. & G.Y. revealed staphylococci (80%), Bacillus subtilis (10%), and Gram negative bacilli (10%), from doctors and Gram positive diplococci (10%), instead of Gram negative bacilli (10%), from nurses. 10. The strain isolated from nasal cavity of parturient women on admission revealed staphylococci (90%), and Gram negative bacilli (10%), but after admission revealed staphylococci (70%), Gram positive diplococci (10%), and Gram negative bacilli (10%). 11. Of the total 91 staphylococci isolated from the air of the ward, the Coagulase pastive was 36 (39.6%), and the negative 55 (60.4%), As a result of the coagulase experiment of the staphylococci isolated from the nasal cavity of those who are engaged in the ward of O.B. & G.Y. all were revealed as negative that belonged to non-pathogenic. 12. Consequence of the biochemic examination of the gram negative bacilli isolated from the air of the ward the aerobacter aerogens revealed was (16.7%) E-coli 5% in the nasal cavity of those came and went to the of O.B. & G.Y. and Aerobacter aerogens 7.5%.

  • PDF

Effects of N-acetylcysteine on biofilm formation by MBR sludge

  • Song, WonJung;Lade, Harshad;Yu, YoungJae;Kweon, JiHyang
    • Membrane and Water Treatment
    • /
    • 제9권3호
    • /
    • pp.195-203
    • /
    • 2018
  • N-acetylcysteine (NAC) has been widely used as an initial mucolytic agent and is generally used as an antioxidant to help alleviate various inflammatory symptoms. NAC reduces bacterial extracellular polymeric substances (EPS) production, bacterial adhesion to the surface and strength of mature biofilm. The efficacy has been shown to inhibit proliferation of gram-positive and gram-negative bacteria. In membrane bioreactor (MBR) processes, which contain a variety of gram negative bacteria, biofilm formation has become a serious problem in stable operation. In this study, use of NAC as an inhibitor of biofilm contamination was investigated using the center for disease control (CDC) reactors with MBR sludge. Biomass reduction was confirmed with CLSM images of membrane surfaces by addition of NAC, which was more efficient as the concentration of NAC was increased to 1.5 mg/mL. NAC addition also showed decreases in EPS concentrations of the preformed biofilm, indicating that NAC was able to degrade EPS in the mature biofilm. NAC addition was also effective to inhibit biofilm formation by MBR sludge, which consisted of various microorganisms in consortia.

사용자 검색 질의 단어의 순서 및 단어간의 인접 관계에 기반한 검색 기법의 구현 (Implementation of Search Method based on Sequence and Adjacency Relationship of User Query)

  • 소병철;정진우
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.724-729
    • /
    • 2011
  • 정보 검색은 다수 자료에서 사용자가 원하는 부분을 찾는 과정을 의미한다. 일반적으로 대규모 자료 집합의 관리를 위해서는 데이터베이스가 사용되는데 인터넷과 같은 복잡한 문서구조들이 공존하는 환경에서는 한 번에 사용자가 원하는 문서를 정확히 찾아내는 것이 어렵기 때문에, 문서에 순위를 부여하여 사용자에게 제시하는 방법이 일반적으로 많이 사용된다. 본 논문에서는 자료에 포함되어 있는 단어들을 단순히 검색하는 것 뿐만 아니라 단어들 간의 순서 및 인접성을 고려한 검색방법을 용어빈도-역문헌빈도 및 n-gram 기법을 응용하여 구현하였다. 그 결과 19,000개 이상의 다수 문서 집합에서 73%의 정확율로 보다 정확한 검색이 가능하게 되었다.