• 제목/요약/키워드: n-gram

Search Result 577, Processing Time 0.027 seconds

Nelumbo nucifera extracts mediated synthesis of silver nanoparticles for the potential applications in medicine and environmental remediation

  • Supraja, N.;Avinash, B.;Prasad, T.N.V.K.V.
    • Advances in nano research
    • /
    • v.5 no.4
    • /
    • pp.373-392
    • /
    • 2017
  • Silver nanoparticles (AgNPs) were successfully synthesized through a simple green route using the Nelumbo nucifera leaf, stem and flower extracts. These nanoparticles showed characteristic UV-Vis absorption peaks between 410-450 nm which arises due to the plasmon resonance of silver nanoparticles. The Fourier transform infrared spectroscopy (FT-IR) confirmed the presence of amides and which acted as the stabilizing agent. X-ray diffraction spectrum of the nanoparticles confirmed the Face centered cubic (FCC) structure of the formed AgNPs. Dynamic light scattering technique was used to measure hydrodynamic diameter (68.6 nm to 88.1 nm) and zeta potential (-55.4 mV, -57.9 mV and 98.9 mV) of prepared AgNPs. The scanning electron micrographs of dislodged nanoparticles in aqueous solution showed the production of reasonably monodispersed silver nanoparticles (1-100 nm). The antimicrobial activity of prepared AgNPs was evaluated against fungi, Gram-positive and Gram-negative bacteria using disc diffusion method. Anti-corrosion studies were carried out using coupon method (mild steel and iron) and dye degradation studies were carried out by assessing photo-catalytic activity of Nelumbo nucifera extracts mediated AgNPs.

Korean Phoneme Sequence based Word Embedding (한국어 음소열 기반 워드 임베딩 기술)

  • Chung, Euisok;Jeon, Hwa Jeon;Lee, Sung Joo;Park, Jeon-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

Korean Phoneme Sequence based Word Embedding (한국어 음소열 기반 워드 임베딩 기술)

  • Chung, Euisok;Jeon, Hwa Jeon;Lee, Sung Joo;Park, Jeon-Gue
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.225-227
    • /
    • 2017
  • 본 논문은 한국어 서브워드 기반 워드 임베딩 기술을 다룬다. 미등록어 문제를 가진 기존 워드 임베딩 기술을 대체할 수 있는 새로운 워드 임베딩 기술을 한국어에 적용하기 위해, 음소열 기반 서브워드 자질 검증을 진행한다. 기존 서브워드 자질은 문자 n-gram을 사용한다. 한국어의 경우 특정 단음절 발음은 단어에 따라 달라진다. 여기서 음소열 n-gram은 특정 서브워드 자질의 변별력을 확보할 수 있다는 장점이 있다. 본 논문은 서브워드 임베딩 기술을 재구현하여, 영어 환경에서 기존 워드 임베딩 사례와 비교하여 성능 우위를 확보한다. 또한, 한국어 음소열 자질을 활용한 실험 결과에서 의미적으로 보다 유사한 어휘를 벡터 공간상에 근접시키는 결과를 보여 준다.

  • PDF

Word and class-based language modeling for Korean (단어와 클래스 기반의 한국어 언어 모델링)

  • Kim, Kil-Youn;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.221-225
    • /
    • 2001
  • 본 논문에서는 대량의 말뭉치를 바탕으로 한국어에 대해 단어 기반의 n-gram 언어 모델과 클래스 기반의 언어 모델을 구축하고, 이를 실험적으로 검증한다. 단어 기반의 n-gram 모델링의 경우 Katz의 백오프와 Kneser-ney의 스무딩(smoothing) 알고리즘에 대해 실험을 수행한다. 클래스 기반의 언어 모델의 경우에는 품사 태그를 단어의 클래스로 사용한 경우와 말뭉치로부터 자동으로 구축된 클래스를 사용한 경우로 나누어 실험한다. 마지막으로 단어 기반 모델과 클래스 기반 모델을 결합하여 각각의 모델과 그 성능을 비교한다. 실험 결과 단어 기반의 언어 모델의 경우 Katz의 백오프에 비해 Knerser-ney의 스무딩이 보다 조은 성능을 나타내었다. 클래스 기반의 모델의 경우 품사 기반의 방범보다 자동 구축된 단어 클래스를 이용하는 방법의 성능이 더 좋았다. 또한, 단어 모델과 클래스 모델을 결합한 모델이 가장 좋은 성능을 나타냈다. 논문의 모든 알고리즘은 직접 구현되었으며 KLM Toolkit이란 이름으로 제공된다.

  • PDF

Dependency relation analysis and mutual information technique for ASR rescoring (음성인식 리스코링을 위한 의존관계분석과 상호정보량 접근방법의 비교)

  • Chung, Euisok;Jeon, Hyung-Bae;Park, Jeon-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.164-166
    • /
    • 2014
  • 음성인식 결과는 다수의 후보를 생성할 수 있다. 해당 후보들은 각각 음향모델 값과 언어모델 값을 결합한 형태의 통합 정보를 갖고 있다. 여기서 언어모델 값을 다시 계산하여 성능을 향상하는 접근 방법이 일반적인 음성인식 성능개선 방법 중 하나이며 n-gram 기반 리스코링 접근 방법이 사용되어 왔다. 본 논문은 적절한 성능 개선을 위하여, 대용량 n-gram 모델의 활용 문제점을 고려한 문장 구성 어휘의 의존 관계 분석 접근 방법 및 일정 거리 어휘쌍들의 상호정보량 값을 이용한 접근 방법을 검토한다.

  • PDF

광섬유 레이저 센서

  • 김향균
    • Korean Journal of Optics and Photonics
    • /
    • v.4 no.4
    • /
    • pp.480-486
    • /
    • 1993
  • We propose and demanstrate a fiber laser as a sensor, whose output is the frequency of beat signals between eigenpolarization modes of the fiber laser. For the measurement of lateral stress, proportional constant of 4.8 kHz/gram is obtained with a good linearity. For the measurements of temperature and longitudinal strain applied to the polarization maintaining fiber laser, proportional constants of 30 kHz/$^{\circ}C$ -cm, and 43 kHz/${\mu}m$, respectively, are obtained.

  • PDF

An Improving Method of Efficiency for Word Clustering Based on Language Model (언어모델 기반 단어 클러스터링 알고리즘의 효율성 향상 기법)

  • Park, Sang-Woo;Kim, Youngtae;Kang, Dong-Min;Ra, Dongyul
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.55-60
    • /
    • 2011
  • 단어 클러스터링 (word clustering) 또는 군집화는 자연어처리에서 데이터 부족 문제로 인하여 단어 간의 의미관계와 관련된 정보를 사용하기 어렵게 만드는 문제에 대처할 수 있는 중요한 기술이다. 단어 클러스터링과 관련하여 알려진 가장 대표적인 기법으로는 클래스-기반 n-gram 언어모델의 개발을 위하여 제안된 Brown 단어 클러스터링 기법이다. 그러나 Brown 클러스터링 기법을 이용하는데 있어서 부딪치는 가장 큰 문제점은 시간과 공간적인 면에서 자원 소요량이 너무 방대하다는 점이다. 본 연구는 이 클러스터링 기법의 효율성을 개선하는 실험을 수행하였다. 실험 결과 가장 단순한(naive) 접근에 비하여 약 7.9배 이상의 속도 향상을 이룰 수 있음을 관찰하였다.

  • PDF

Cystocin, a Novel Antibiotic, Produced by Streptomyces sp. GCA0001: Biological Activities

  • Lee, Hei-Chan;Liou, Kwangkyoung;Kim, Dae-Hee;Kang, Sun-Yub;Woo, Jin-Suk;Sohng, Jae-Kyung
    • Archives of Pharmacal Research
    • /
    • v.26 no.6
    • /
    • pp.446-448
    • /
    • 2003
  • Cystocin belongs to the class of nucleoside antibiotics from Streptomyces sp. GCA0001. Cystocin showed good activity against Gram-positive bacteria, but showed less activity against the Gram-negative bacteria. Cystocin exhibited about two to four folds higher activity than puromycin. Especially, cystocin shows relatively strong activity against Streptococcus strains. Cystocin shows quite potent antitumor activity against all of the cells tested showing $IC_{50}$ values of 0.10 to 0.14 $\mu$ g/mL. This in vitro result indicates that the cytotoxocity of cystocin is two ten folds more active than puromycin s.

N-gram Adaptation using Information Retrieval and Dynamic Interpolation Coefficient (정보검색 기법과 동적 보간 계수를 이용한 N-gram 적응)

  • Choi, Joon-Ki;Oh, Yung-Hwan
    • Proceedings of the KSPS conference
    • /
    • 2005.11a
    • /
    • pp.107-112
    • /
    • 2005
  • 연속음성인식을 위한 언어모델 적응기법은 특정 영역의 정보만을 담고 있는 적응 코퍼스를 이용해 작성한 적응 언어모델과 기본 언어모델을 병합하는 방법이다. 본 논문에서는 추가되는 자료 없이 인식 시스템이보유하고 있는 코퍼스만을 사용하여 적응 코퍼스를 구축하기 위해 언어모델에 기반한 정보검색 기법을 사영하였다. 검색된 적응 코퍼스로 작성된 적응 언어모델과 기본 언어모델과의 병합을 위해 본 논문에서는 입력음성을 분할하여 각 구간에 최적인 동적 보간 계수를 구하는 방법을 제안하였다. 제안된 적응 코퍼스를 구하는 방법과 동적 보간 계수는 기본 언어모델 대비절대 3.6%의 한국어 방송뉴스 인식 성능 향상을 보여주었으며 기존의 검증자료를 이용한 정적 보간 계수에 비해 상대 13.6%의 한국어 방송뉴스 인식 성능 향상을 보여 주었다.

  • PDF

Use Case of Google Trigram: Application to Text Editor (구글 Trigram의 활용 사례: 문서 편집기로의 활용)

  • Hwang, Myung-Gwon;Lee, Hyo-Gap;Choi, Dong-Jin;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.3-5
    • /
    • 2010
  • 본 논문은 구글(Google)에서 제공하는 n-gram 데이터가 사람들에게 실제로 어느정도의 효율성을 제공할 수 있는지에 대한 내용을 다루고 있다. 이를 위해, 구글의 trigram만을 이용하며, 규모를 줄이기 위해 필터링 과정을 거쳐 trigram 데이터베이스를 형성하였다. 그리고 이를 반영할 수 있는 텍스트 에디터를 구현하여, 사람의 타이핑 속도에 따라 얻을 수 있는 효율성을 측정하였다. 실험 결과에서 n-gram 데이터가 업무 향상에 효율성을 제공할 수 있지만, 여전히 큰 규모의 데이터집합에서 검색하는데 소모되는 시간의 한계점을 발견할 수 있었다.