• 제목/요약/키워드: 구조적 분류

검색결과 3,023건 처리시간 0.056초

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Integrated Clustering Method based on Syntactic Structure and Word Similarity for Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-49
    • /
    • 2009
  • 통계기계번역에서 도메인에 특화된 번역을 시도하여 성능향상을 얻는 방법이 있다. 이를 위하여 문장의 유형이나 장르에 따라 클러스터링을 수행한다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 문장 사이의 문법적 구조 유사성으로 문장을 유형별로 분류하는 새로운 기법을 제시하였고, 단어 유사도 정보로 문서의 장르를 구분하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조의 유사성과 단어 유사도 계산을 위하여 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정은 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

  • PDF

주요 포털들의 서비스 분류체계 비교 분석 (An Analysis of Service Classification Systems Provided by Major Korean Search Portals)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제44권2호
    • /
    • pp.241-262
    • /
    • 2010
  • 본 연구에서는 국내 주요 검색 포털들인 네이버, 네이트, 다음, 야후에서 제공하는 서비스들의 분류체계를 분류체계의 일관성, 분류체계의 논리성, 인터페이스의 일관성, 카테고리명의 명확성, 카테고리 및 사이트 배열 순서, 계층 구조 설계 등의 관점에서 비교, 분석하였다. 이러한 기준에 따라 조사한 결과, 동일한 포털에서 제공하는 서비스들이 공통점이 거의 없는 독자적인 분류체계를 구축, 운영하고 있는 것으로 나타났다. 따라서 향후 포털들의 통합 분류체계 구축과 인터페이스 표준화가 요구된다. 본 연구의 결과는 포털들의 분류체계의 개선에 활용될 수 있을 것으로 기대된다.

온톨로지 기반 웹 문서 분류 (Ontology-Based Document Classification)

  • 송무희;임수연;민도식;강동진;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.535-537
    • /
    • 2003
  • 본 논문에서는 웹 문서들이 가지는 용어 정보들과 어휘들의 의미구조를 계층적 형태로 표현한 온틀로지 기반 자동 문서분류 방법을 제안한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 점하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하며, 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

객체의 분류를 위한 효율적인 다층퍼셉트론의 설계 및 구조에 관한 연구 (A Study on the design and Structure of Multi-Layer Perceptron for Effective Classifying Objects)

  • 이용규;고형일;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.803-805
    • /
    • 2014
  • 다층 퍼셉트론 분류기는 그 패턴 분류 성능이 훌륭하여 오랜 기간 동안 여러 응용분야에서 사용되어 왔다. 그러나 다른 분류기보다 학습시간이 오래 소요된다는 점이 문제로 지적받아 왔다. 따라서 본 논문은 회전하는 객체의 분류를 위하여 다층 퍼셉트론의 학습시간을 줄이는 효율적인 신경망 시스템을 제안한다. 주성분 분석법을 이용하여 원 데이터의 정보를 가장 잘 잘 나타내도록 변환한 뒤, 그 결과를 다층 퍼셉트론 분류기의 입력으로 사용하였다. 제안하는 시스템은 기존 다층 퍼셉트론 분류기와 비교하였을 때 학습시간을 줄이면서 좀 더 높은 인식률을 보였다.

계층구조의 분류를 통한 서포트벡터머신 기반의 음성/음악 분류기의 실용도 향상기법 (A Technique to Improve the Practicality of SVM-based Speech/Music Classifiers Through Hierarchical Classification)

  • 최석환;조용옥;조지우;임정수;이연우;이성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1033-1034
    • /
    • 2012
  • 본 논문은 제한된 대역폭의 효율적인 활용을 위한 가변 전송률 코덱을 목표로 제안된 서포트벡터머신 기반의 음성/음악 분류기의 실용도를 높이기 위한 기법을 제안한다. 서포트벡터머신 기반의 음성/음악 분류기는 높은 분류능력을 가지고 있지만 많은 계산량을 요구하기 때문에 실시간으로 사용하기에는 부적합한 면이 있다. 따라서 계층적 분류를 통해 서포트벡터머신 기반의 음성/음악 분류기의 실용성을 향상시키는 기법을 제안한다.

데이터 마이닝을 위한 LVQ 기반 신경 트리 분류기 (Neural Tree Classifier based on LVQ for Data Mining)

  • 김세현;김은주;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.157-159
    • /
    • 2001
  • 신경 트리는 신경망과 결정 트리의 구조를 결합한 형태의 분류기로서 비선형적 결정 경계 형성이 가능하며 기존 신경망에 비해 학습, 출력시 계산량이 적다는 장점을 갖는다. 본 논문에서는 신경 트리의 노드를 구성하는 신경망을 학습하기 위하여 기존의 방법들과는 달리 교사 학습 방법인 LVQ3 알고리즘을 사용하는 신경 트리 분류기를 제안한다. 학습 과정을 통해 생성된 트리는 오인식율 추정을 이용한 가지치기를 통하여 효율적인 트리로 재구성된다. 제안하는 방법은 실제 데이터 집합들을 이용한 실험을 통하여 그 성능을 검증하였다.

  • PDF

미나리아재비과 동의나물아족의 종피형태와 분류학적 검토 (Taxonomic Implications of Seed Coat in the Subtribe Calthinae (Ranunculaceae))

  • 허권;서영배
    • 식물분류학회지
    • /
    • 제38권1호
    • /
    • pp.1-16
    • /
    • 2008
  • 한국 고유종인 모데미풀의 분류학적 검토를 위하여 모데미풀과 근연분류군의 종피 형태를 관찰하였다. 모데미풀의 종피 형태는 외종피 세포가 책상조직모양의 후벽세포로 발달하는 외종피외층형으로 나타났고, 종피의 표면은 오목형 구조를 보였다. 근연분류군인 동의나물의 외종피 외층은 입방형(cuboid)이며, 표면구조는 매끄러워서 모데미풀과 같은 책상조직 형태의 후벽세포로 잘 발달하였으며, 종피 표면 구조는 오목형과 볼록형이 연속적으로 나타났다. 이것은 모데미풀속의 종피구조가 금매화속의 종피구조 범위내에 포함됨을 암시하고 있다. 따라서 동의나물 아족에서는 종피의 해부형태와 표면구조가 아족내에서 분류학적 평가에 유용하게 사용될 수 있었다. 결론적으로, 종피의 표면구조와 행부형태 특징은 고유종인 모데미풀이 동의나물속이나 Calathodes속보다는 금매화속에 보다 가깝다는 것을 나타내었다. 종피의 오목형 표면구조와 잘 발달된 외종피 외층형 종피유형은 모데미풀과 금매화속이 함께 공유하는 형질이었다.

웹을 위한 데이터베이스 통로의 분류체계 연구 (A Taxonomy on Database Gateways for WWW)

  • 정지문;이삼일;최성
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2000년도 추계학술대회
    • /
    • pp.297-301
    • /
    • 2000
  • 대규모 멀티미디어 데이타베이스 서비스 시스템은 월드와이드 웹(WWW : World Wide Web)의 대규모 멀티미디어 정보 서비스의 우수성과 데이타베이스 시스템의 방대한 데이타베이스 관리 기능을 상호 보완적으로 통합함으로써 구현할 수 있다. 데이타베이스 통로는 이러한 통합의 핵심적인 소프트웨어라 할 수 있다. 데이타베이스 통로의 필요성이 인식된 후로 현재 많은 상용 및 연구용 제품이 개발되어 왔다. 데이타베이스 통로의 구조는 데이타베이스 접속을 WWW 에 어떻게 연동시키는가에 따라 다양하게 나누어지고 구조에 따라 성능도 달라지게 된다. 데이타베이스 통로의 성능은 대규모 데이타베이스 서비스 시스템 구축에 매우 중요하다고 할 수 있다. 이 문서에서는 여러가지 데이타베이스 통로의 구조에 대하여 분류체계를 세우고, 각 구조에 대한 특징을 성능 및 기능에 대하여 연구하였다.

잠재 의미 색인 기법을 이용한 국제 특허 분류 (International Patent Classificaton Using Latent Semantic Indexing)

  • 진훈태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1294-1297
    • /
    • 2013
  • 본 논문은 기계학습을 통하여 특허문서를 국제 특허 분류(IPC) 기준에 따라 자동으로 분류하는 시스템에 관한 연구로 잠재 의미 색인 기법을 이용하여 분류의 성능을 높일 수 있는 방법을 제안하기 위한 연구이다. 종래 특허문서에 관한 IPC 자동 분류에 관한 연구가 단어 매칭 방식의 색인 기법에 의존해서 이루어진바가 있으나, 현대 기술용어의 발생 속도와 다양성 등을 고려할 때 특허문서들 간의 관련성을 분석하는데 있어서는 단어 자체의 빈도 보다는 용어의 개념에 의한 접근이 보다 효과적일 것이라 판단하여 잠재 의미 색인(LSI) 기법에 의한 분류에 관한 연구를 하게 된 것이다. 실험은 단어 매칭 방식의 색인 기법의 대표적인 자질선택 방법인 정보획득량(IG)과 카이제곱 통계량(CHI)을 이용했을 때의 성능과 잠재 의미 색인 방법을 이용했을 때의 성능을 SVM, kNN 및 Naive Bayes 분류기를 사용하여 분석하고, 그중 가장 성능이 우수하게 나오는 SVM을 사용하여 잠재 의미 색인에서 명사가 해당 용어의 개념적 의미 구조를 구축하는데 기여하는 정도가 어느 정도인지 평가함과 아울러, LSI 기법 이용시 최적의 성능을 나타내는 특이값의 범위를 실험을 통해 비교 분석 하였다. 분석결과 LSI 기법이 단어 매칭 기법(IG, CHI)에 비해 우수한 성능을 보였으며, SVM, Naive Bayes 분류기는 단어 매칭 기법에서는 비슷한 수준을 보였으나, LSI 기법에서는 SVM의 성능이 월등이 우수한 것으로 나왔다. 또한, SVM은 LSI 기법에서 약 3%의 성능 향상을 보였지만 Naive Bayes는 오히려 20%의 성능 저하를 보였다. LSI 기법에서 명사가 잠재적 의미 구조에 미치는 영향은 모든 단어들을 내용어로 한 경우 보다 약 10% 더 향상된 결과를 보여주었고, 특이값의 범위에 따른 성능 분석에 있어서는 30% 수준에 Rank 되는 범위에서 가장 높은 성능의 결과가 나왔다.

난류충돌유동의 질량유량비에 따른 혼합유동구조에 관한 실험적 연구 (An Experimental Study on the Mixing Flow Structure of Turbulent Cross Flow with Respect to the Ratio of Mass Flow Rate)

  • 이대옥;노병준
    • 대한기계학회논문집
    • /
    • 제16권11호
    • /
    • pp.2150-2158
    • /
    • 1992
  • 본 연구에서는 복잡한 유동형태를 지닌 충돌분사류에 대한 유동특성을 연구하 기 위하여 단순화된 실험모델로써 형상이 동일한 두 원형분류의 충돌에 의한 충돌분류 의 혼합현상 및 유동구조 등을 질량유량비의 변화에 따라 유체역학적으로 구명하고자 하였으며, 본 연구 결과는 연소기관에서의 연소효율 증대 및 구조개선등의 공학적 응 용을 위한 기본자료로 활용하고, 이론적 연구에 의한 난류의 유동구조 및 유동특성 에 대한 타당성 입증과 이론적 모델의 보완을 위한 실험자료로 이용하고자 한다. 충돌유동에 영향을 미치는 주요인자는 노즐직경, 충돌각, 충돌질량유량비, 온도, 밀도 등이며, 이 인자들 중에서 충돌질량유량비와 출돌각이 충돌후 형성되는 난류혼합유동 에 지배적인 영향을 미치므로, 본 연구에서는 두 원형분류의 충돌질량유량비를 가변할 수 있는 장치를 고안하였으며, 두 분류의 충돌각을 45˚로 고정하고, 고속측과 저속측 노즐의 질량유량비를 1.0, 0.8, 0.6, 0.4로 설정하여 질량유량비에 따른 혼합 유동구 조의 구명을 위한 실험적인 연구를 수행하였다. 충돌후의 혼합유동의 특성을 연구하 기 위하여 유동중심궤적, 유동반폭, 유동단면, 2차원 및 3차원 유동장, 평균속도분포 등을 온라인 컴퓨터시스템을 이용하여 측정분석하였다.