• 제목/요약/키워드: Topic type

검색결과 350건 처리시간 0.021초

문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화 (Automatic Text Categorization Using Passage-based Weight Function and Passage Type)

  • 주원균;김진숙;최기석
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.703-714
    • /
    • 2005
  • 문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다.

응집장치가 과학텍스트의 기억과 이해에 미치는 효과 (The Effect of Cohesive Devices on Memory and Understanding of Scientific Text)

  • 김세영;한광희;조숙환
    • 인지과학
    • /
    • 제13권2호
    • /
    • pp.1-13
    • /
    • 2002
  • 본 논문에서는 표층 언어 표현의 응집성 (coherence)이 과학 텍스트의 이해에 어떤 효과를 주는지에 대해 검토하였다 이 연구는 응집성의 강도가 과학 텍스트 이해의 정도와 관계가 있는 지 검토하고. 텍스트의 이해가 지엽적 응집성과 총체적 응집성의 관점으로 어떻게 설명될 수 있는지, 또는 다른 요인과 어떠한 관계가 있는지 조사하였다. 이해에 대한 응집성 강도의 효과를 알아보기 위하여 원인, 반복, 직시사 (deixis). 정박 (anchoring)등의 응집장치 (cohesive devices)를 이용하여 텍스트의 응집성 강도를 조작하였으며. 이에 대한 오프라인 처리 과제를 실시하였다 실험 결과, 응집성이 강한 텍스트가 보다 용이하게 이해된 것으로 나타났다 단락별로 분석된 회상 및 재인 검사의 결과에서는 응집장치의 종류에 따른 응집성 효과가 선택적으로 나타났다 이는 응집장치의 지엽적 효과가 일관적이지 않다는 것을 의미하는 것으로 보인다. 한편 텍스트의 주제가 얼마나 긴밀하게 연결되었는지 분석한 결과. 주제 연결 (topic continuity)의 긴밀성 정도가 텍스트 이해와 관련되어 있음을 발견하게 되었다 이러한 결과는 텍스트 이해가 지엽적 응집성의 선택적 효과에 의해 구축되는 상향적 (bottom-up) 과정뿐만 아니라. 텍스트 전체를 지배하는 하향적 (top-down) 과정에 의해 촉진됨을 암시한다

  • PDF

텍스트 마이닝을 활용한 황해 관련 연구동향 분석연구 (Analysis of Research Trends in Relation to the Yellow Sea using Text Mining)

  • 황규원;김진경;강승구;강길모
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.724-739
    • /
    • 2023
  • 황해는 지정학적으로 한국, 중국, 북한 사이 해역에 위치하고 있으며, 최근 해양공간 이용이 확대되어 사회적·경제적 가치가 증가하고 있다. 또한 기후변화로 인한 해양환경 변화, 대기오염물질 이동 등 한·중 공동 대응 및 협력의 필요성이 증가되고 있다. 본 연구에서는 황해(Yellow Sea) 키워드의 연구논문을 대상으로 핵심주제(Topic)을 도출하고, 저자 네트워크 분석을 수행하여 연구동향을 탐색하였다. 연구대상으로 1984년부터 2021년 사이에 게재된 Web of Science DataBase의 황해 관련 연구논문을 추출하고, 한중 어업협정, 해양환경공동조사 등 한국과 중국의 주요 이벤트를 중심으로 4개의 시기로 구분하였다. 연구방법으로 텍스트 마이닝(Text Mining)의 일종인 토픽모델링(Topic Modeling)을 활용하여 Topic을 도출하였다. 또한 저자 네트워크를 분석하여 해당 분야의 주요 연구 그룹(Community)과 연구자 및 연구기관의 영향력을 파악하고 시사점을 제시하였다. 분석결과 황해 연구논문의 핵심주제는 1기 퇴적물, 해양생물, 2기 산성화, 미세먼지, 3기 수산양식, 지진, 4기 탄소요인, 해양생태계 등으로 변화하였고, 시기별로 핵심 연구자를 중심의 연구자 그룹이 증가하였다. 연구결과를 토대로 황해 관련 연구 동향과 주요 연구자 및 연구기관을 파악함으로써 향후 한국과 중국 간의 황해 연구협력에 기여하고자 한다.

'작은 생물의 세계' 주제에 대한 초등학생들의 후속 흥미에 영향을 미치는 요인 분석 (Analysis of Factors affecting Elementary School Students' Follow-up Interests on Instructional Topics of Small Organisms' World)

  • 김래현;임채성
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제35권1호
    • /
    • pp.123-135
    • /
    • 2016
  • Interest is one of the important factors in science education. The purpose of this study was to investigate factors affecting the follow-up interest of elementary school students on topics of 'Small Organisms' World'. The follow-up interests of the students on the topic were grouped into three categories; the developed-expanded-deepened (EDD), the simply expanded and maintained (SEM), and the stoped or decreased (SD) types. Each types had specific distinguishing features. Through the examination of students' responses and the in-depth interviews, the factors affecting on the follow-up interests of the students were analyzed. The factors were classified into two types of the external factor and the internal one. While the external factors were mainly related to the instructional materials used in science class and teaching methods, the internal factors were related to the desire for knowing, prior knowledge, students' experience and attitude toward the topics of science. In relation to the types of the follow-up interests, these factors were affected by different causes. The EDD type was most affected by internal factors, such as desire for knowing and prior knowledge. The SEM type was shown to be most affected by external factors, such as instructional materials. The SD type was mainly influenced by external factors, such as teaching methods. From the analysis of internal factors, it was revealed that the attitude and the prior knowledge about the topic are related with the follow-up interests. There was a positive relationship between the levels of science attitude and science knowledge. The students who had EDD type had a higher level of attitude and knowledge. However, there were some students who had higher level of scientific knowledge with SD type. The results of in-depth interviews showed that they were influenced by negative perceptions about science and stress on their grades. In conclusion, each follow-up interest type were caused by the external factors contained in the processes of the science class and the internal ones associated with the individual features and were influenced by the science class. So, the teacher should help the students be able to have the EDD type of follow-up interest which is persisted even after the completion of the science curriculum. For this, when the teachers design science curriculum and plan lesson, they should consider both internal and external factors significantly influencing the students' follow-up interests.

Ampoule-tube 법으로 Phosphorus를 도핑한 P형 ZnO 박막의 광학적 특성 분석 (Alanysis of the Optical Properties of p-type ZnO Thin Films Doped by P based on Ampouele-tube Method)

  • 유인성;오상현;소순진;박춘배
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2006년도 추계학술대회 논문집 Vol.19
    • /
    • pp.145-146
    • /
    • 2006
  • The most Important research topic in the development of ZnO LED and LD is the production of p-type ZnO thin film that has minimal stress with outstanding stoichiometric ratio. In this study, Phosphorus diffused into the undoped ZnO thin films using the ampoule-tube method for the production of p-type znO thin films. The undoped ZnO thin films were deposited by RF magnetron sputtering system on $GaAs_{0.6}P_{0.4}$/GaP and Si wafers. 4N Phosphorus (P) was diffused into the undoped ZnO thin films in ampoule-tube which was performed and $630^{\circ}C$ during 3hr. We found the diffusion condition of the conductive ZnO films which had p-type properties with the highest mobility of above 532 $cm^2$/Vs compared with other studies PL spectra measured at 10K for the purpose of analyzing optical properties of p-type ZnO thin film showed strong PL intensity in the UV emission band around 365nm ~ 415nm and 365nm ~ 385nm.

  • PDF

Quantifiers in Questions

  • Krifka, Manfred
    • 한국영어학회지:영어학
    • /
    • 제3권4호
    • /
    • pp.499-526
    • /
    • 2003
  • This paper, based on Krifka (2001), is about the interpretation of quantifiers in questions. I have argued that quantification into question acts is possible for universal quantifiers, as these quantifiers are based on conjunction, an operation that is defined for speech acts. This explains the restriction to universal quantifiers, which are generalized conjunctions. I have developed a type system in which quantification into question acts can be described. I have argued that expressions that scope out of speech acts must be topic, which explains a number of additional observations. I have also discussed embedded questions, which, depending on the embedding verb, may allow for quantification into questions.

  • PDF

Visual Analytic for Intangible Cultural Heritage in China

  • Nan Zhang
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.722-729
    • /
    • 2023
  • Visual analytic for intangible cultural heritage has recently developed in China. Using advanced interactive visualization tools experts can observe data distribution trends and explore the implicit relationships among data within a short time. It can enhance human cognitive and analytical abilities and improve the scientific preservation of intangible cultural heritage. To support this research topic, we have reviewed recent visualization works on intangible cultural heritage in China. We divide these works into three types: text visualization, multi-dimensional visualization, and geographical visualization. Each type is illustrated by several representative works. New development trends in this area are also discussed.

토픽모델링과 딥 러닝을 활용한 생의학 문헌 자동 분류 기법 연구 (A Study of Research on Methods of Automated Biomedical Document Classification using Topic Modeling and Deep Learning)

  • 육지희;송민
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.63-88
    • /
    • 2018
  • 본 연구는 LDA 토픽 모델과 딥 러닝을 적용한 단어 임베딩 기반의 Doc2Vec 기법을 활용하여 자질을 선정하고 자질집합의 크기와 종류 및 분류 알고리즘에 따른 분류 성능의 차이를 평가하였다. 또한 자질집합의 적절한 크기를 확인하고 문헌의 위치에 따라 종류를 다르게 구성하여 분류에 이용할 때 높은 성능을 나타내는 자질집합이 무엇인지 확인하였다. 마지막으로 딥 러닝을 활용한 실험에서는 학습 횟수와 문맥 추론 정보의 유무에 따른 분류 성능을 비교하였다. 실험문헌집단은 PMC에서 제공하는 생의학 학술문헌을 수집하고 질병 범주 체계에 따라 구분하여 Disease-35083을 구축하였다. 연구를 통하여 가장 높은 성능을 나타낸 자질집합의 종류와 크기를 확인하고 학습 시간에 효율성을 나타냄으로써 자질로의 확장 가능성을 가지는 자질집합을 제시하였다. 또한 딥 러닝과 기존 방법 간의 차이점을 비교하고 분류 환경에 따라 적합한 방법을 제안하였다.

스토킹 관련 언론기사에 대한 텍스트네트워크분석 (Text Network Analysis on Stalking-Related News Articles )

  • 지은선;정상희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.579-585
    • /
    • 2023
  • 본 연구의 목적은 텍스트네트워트분석을 통해 스토킹에 대한 정치성향의 언론기사 내에 핵심 단어를 탐색하고 내재된 의도를 살펴보는 것이다. 2018년 1월 1일부터 2022년 12월 31일까지 보도된 보수언론기사(조선일보, 중앙일보) 824건, 진보언론기사(한겨레신문, 경향신문) 783건으로 총 1,607건을 선정하여 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링 기법으로 도출된 주제범주의 양상을 탐색하였다. 연구결과는 보수언론과 진보언론의 공통된 토픽은 젠더폭력의 인식개선, 신변보호 및 처벌강도, 스토커 신상공개 도출되었고 두 언론의 상이한 토픽은 보수언론에서는 스토커의 가해행위, '신당역 살인사건'의 개요와 진보언론은 '신당역 살인사건'의 가중처벌요구, (사이버공간의) 성착취 범죄 근절로 구성되었다. 본 연구는 스토킹에 대한 언론기사 간의 이념적 의견에 따라 보도형태에 변화가 있음을 시사한다.

변이의 통사ㆍ의미론적 고찰 (A Syntactic and Semantic Analysis of Alternations)

  • 김현효
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.134-138
    • /
    • 2003
  • 본 연구는 언어학의 학파를 떠나 주목받고 있는 논항변이의 현상을 통사 ㆍ 의미론적으로 분석하고자 하였다. 논항변이의 현상을 동사의 특성에 따라 분류한 Levin(1993)을 기초로 Dowty의 의미론적인 해석을 시도하였다. 통사적으로 동일한 구조를 보이는 문장에서 동사의 논항이 바뀌면 의미의 변화가 있는 경우가 연구의 초점이 되고 있다. 의미변화가 초래됨을 기초로 각 동사의 유형을 통사적으로 분류하는데 그치지 않고, 그 부류의 문장들의 의미가 어떠한 영향을 받게 되는가를 고찰하였다. 우선 논항변이 현상을 보이는 동사를 Touch형, Hit형 Cut형, 그리고 Break형 동사로 분류하고 각 동사가 보이는 논항변이 현상에 따라 Middle alternation, Body-part possessor Ascension, Conative Alternation에 각각 어떻게 나타나는지를 점검한다. 이러한 분류에 기초하여 각각의 alternation에 의미론적인 해석을 하고자 시도한 것이다.

  • PDF