• Title/Summary/Keyword: 텍스트 개념

Search Result 382, Processing Time 0.03 seconds

Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents (다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축)

  • 장정호;장병탁
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.5
    • /
    • pp.595-604
    • /
    • 2004
  • Automatic analysis of concepts or semantic relations from text documents enables not only an efficient acquisition of relevant information, but also a comparison of documents in the concept level. We present a multiple cause model-based approach to text analysis, where latent topics are automatically extracted from document sets and similarity between documents is measured by semantic kernels constructed from the extracted topics. In our approach, a document is assumed to be generated by various combinations of underlying topics. A topic is defined by a set of words that are related to the same topic or cooccur frequently within a document. In a network representing a multiple-cause model, each topic is identified by a group of words having high connection weights from a latent node. In order to facilitate teaming and inferences in multiple-cause models, some approximation methods are required and we utilize an approximation by Helmholtz machines. In an experiment on TDT-2 data set, we extract sets of meaningful words where each set contains some theme-specific terms. Using semantic kernels constructed from latent topics extracted by multiple cause models, we also achieve significant improvements over the basic vector space model in terms of retrieval effectiveness.

An Implementation of a Stepwise Learning Model for Learner-based Solving of Mathematical Problems on the Remote Instruction (학습자 중심의 수학문제 풀이를 위한 원격강의 단계학습 모텔 구현)

  • 조우제;이춘근;김태석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.367-372
    • /
    • 2001
  • 본 논문에서는 웹 상에서 자기 주도적 학습 능력을 필요로 하는 수학의 개념적 학습을 멀티미디어 체계적인 웹 기반 코스웨어 설계모형을 제시하였으며 학습자 중심의 교육 방법으로 원격지에서 멀티미디어 요소를 웹 기반으로 하는 실시간 수학문제 풀이 원격교육 시스템을 구현하였다. 이는 웹 기반의 수학 코스웨어(Coureware) 및 텍스트 모드로 제작 설계되었다. 이 수학 문제 풀이 원격교육 시스템은 자기 주도적 수학문제 푼이 단계학습을 목적으로 한다.

  • PDF

Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents (XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리)

  • 박천수;임동수;박종현;강민구;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

Clustering Method of Class using Aggregation Concepts (집합(Aggregation)개념을 이용한 클래스의 클러스터링 방법)

  • Lim, Keun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.519-521
    • /
    • 2000
  • 본 논문에서는 클러스터 정의시 사용하게 되는 특성으로 노드간 패스 수에 기반한 K-edge 컴포넌트의 그래픽 정의 방법과 노드를 클러스터화 하는 집합화(Aggregation)방법을 제시하였다. 집단화된 하이퍼텍스트 분리를 통해 이전 결과를 개선할 수 있으며, 집단내의 노드간 관련성을 가시화하여 비교할 수 있다.

  • PDF

Web Traffic Data Analyze for Cache Server (캐시 서버를 위한 웹 트래픽 데이터 분석)

  • Seulki Jung;Yillbyung Lee
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.1303-1306
    • /
    • 2008
  • 전체 웹 트래픽 요소 중 가장 큰 비중을 차지하는 HTTP 트래픽을 대상으로 하여 과거의 데이터와 비교 분석해 보았다. 현재의 웹 페이지의 경우 최소 10개~ 20개 이상의 또 다른 객체를 요청 하게 되고 있음을 발견했다. 이는 텍스트가 주를 이루었던 과거의 객체들과 매우 다른 양상을 보인다. 최근의 웹 트레이스 로그를 분석하여 기존 알고리즘들의 문제점을 발견하여 지적 하며 새로운 캐싱 알고리즘의 개념을 제안한다.

The concept presentation method presented in the middle school informatics textbook Impact on learners' understanding (중학교 정보교과 개념 제시 방법이 학습 이해도에 미치는 영향)

  • Park, Jin Yong;Beak, Song Yi;Lee, Eun joo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.20 no.4
    • /
    • pp.345-352
    • /
    • 2019
  • The 2015 revised information curriculum emphasizes the ability to solve problems in real life based on the basic concepts, principles and techniques of computer science. How the contents of textbooks are designed is an important issue in terms of achievement of educational goals and whether contents can be easily and clearly communicated. The purpose of this study is to analyze the concept presentation method presented in middle school informatics textbooks by three types of text- centered type, picture-centered type, and case-centered type- to analyze differences in understanding according to individual variables (sex, subject preference). Analysis results found the figure-centered type showed the highest degree of comprehension among students, and the preference of contents design type and the difference of understanding according to sex did not show significant differences. According to the preferred subjects, understanding of the content design types were found to be significantly different according to preferred subjects.

Development of a Personalized Link-based Search Engine using Fuzzy Concept Network (퍼지 개념 네트워크를 이용한 개인화된 링크기반 검색엔진의 개발)

  • Kim, Gyeong-Jung;Jo, Seong-Bae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.3
    • /
    • pp.211-219
    • /
    • 2001
  • 텍스트 정보만을 이용하는 일반적인 검색엔진들의 한계를 극복하여 향상된 결과를 내기 위하여 링크 구조를 이용해 검색을 수행하는 시스템이 새롭게 등장하고 있다. 링크 구조는 사용자의 질의에 대해 중요한 문서들을 가려준다. 본 논문에서는 한 걸음 더 나아가 링크 정보를 이용하여 검색된 웹 페이지들 중 사용자의 기호에 적절한 결과를 도출하는 방법을 제안한다. 사용자 프로파일에 기반한 퍼지 개념 네트워크로 구축된 퍼지 문서 추출 시스템은 사용자의 성향을 반영하여 링크 기반 검색결과를 개인화 한다. 5명의 사용자에 대한 실험결과, 개발한 시스템이 의미 있는 웹 페이지를 검색함은 물론이고 사용자의 성향을 잘 반영함을 알 수 있었다.

  • PDF

Web Document Retrieval based on Conceptual Distance and Density (개념적 거리와 밀도를 이용한 웹 문서 검색)

  • Hwang Hee-Chul;Choi Chang;Kim Pan-Koo
    • Annual Conference of KIPS
    • /
    • 2006.05a
    • /
    • pp.817-820
    • /
    • 2006
  • 최근 인터넷 기술의 비약적인 발전으로 웹상에 많은 양의 정보가 존재하고, 많은 사람들이 이를 검색하고 활용하게 되었다. 그러나 기존의 검색방식은 단순히 텍스트 매칭(Text matching) 방법을 사용하고 있어 많은 자료들 사이에서 자신이 원하는 자료를 찾는데 어려움이 있다. 이에 본 논문에서는 검색할 자료의 정보를 바탕으로 그와 유사한 자료를 검색해주는 웹 문서 검색 시스템을 제안하고자 한다. 이를 위해 울산대학교 어휘 지능망인 U-WIN을 기반으로 개념적 밀도와 단어 간의 유사성 측정을 이용하여 의미적인 검색이 되도록 하였다.

  • PDF

A Study on Trend in Reinterpretation of Architectonic Programming as a Schematic Factor in Contemporary Architecture (현대건축디자인에서 개념요소로서 프로그래밍의 재해석 경향에 관한 연구)

  • 김능현
    • Korean Institute of Interior Design Journal
    • /
    • no.25
    • /
    • pp.272-279
    • /
    • 2000
  • It can be characterized that contemporary architects intend to establish architectonics which can make it possible to reinterpret the attribute of movement in space and its programming differed from the traditional perception in moving in and out any space through disjoining and reorganizing human behavior and event. This intends reflect new paradigm for subjugating the compelled fuctioning of modern Architecture. This Study review those intends focused on programming as a pre-disign schema. In those intends, it connotes the effort of establishing more systemic and logical approach through deconstruction and disprogramming the existing from, space, elements and human on the basis of his own schematic conception as substitution of function in modern architecture.

  • PDF

Concept and Application of Deep learning-based Automatic Spacing (문장 정보를 고려한 딥 러닝 기반 자동 띄어쓰기의 개념 및 활용)

  • Cho, Won Ik;Cheon, Sung Jun;Kim, Ji Won;Kim, Nam Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.181-184
    • /
    • 2018
  • 본 논문에서는, 한국어 활용에 있어 중의성을 해소해 주고 심미적 효과를 줄 수 있는 개념인 띄어쓰기를, 교정이 아닌 입력 보조의 관점에서 접근한다. 사람들에게 자판을 통한 텍스트 입력이 언어활동의 보편적인 수단이 되면서 가독성을 포기하고서라도 편의를 택하는 경우가 증가하게 되었는데, 본 연구에서는 그러한 문장들의 전달력을 높여 줄 수 있는 자동 띄어쓰기 및 그 활용 방안을 제시한다. 전체 시스템은 dense word embedding과 딥 러닝 아키텍쳐를 활용하여 훈련되었으며, 사용된 코퍼스는 비표준어 및 비정형을 포함하는 대화체 문장으로 구성되어 user-generate된 대화형 문장 입력의 처리에 적합하다.

  • PDF