• Title/Summary/Keyword: 단어 유사도 분석

Search Result 231, Processing Time 0.024 seconds

Comparative analysis of informationattributes inchemical accident response systems through Unstructured Data: Spotlighting on the OECD Guidelines for Chemical Accident Prevention, Preparedness, and Response (비정형 데이터를 이용한 화학물질 사고 대응 체계 정보속성 비교 분석 : 화학사고 예방, 대비 및 대응을 위한 OECD 지침서를 중심으로)

  • YongJin Kim;Chunghyun Do
    • Journal of Intelligence and Information Systems
    • /
    • v.29 no.4
    • /
    • pp.91-110
    • /
    • 2023
  • The importance of manuals is emphasized because chemical accidents require swift response and recovery, and often result in environmental pollution and casualties. In this regard, the OECD revised OECD Guidelines for the Prevention, Preparedness, and Response to Chemical Accidents (referred to as the OECD Guidelines), in June 2023. Moreover, while existing research primarily raises awareness about chemical accidents, highlighting the need for a system-wide response including laws, regulations, and manuals, it was difficult to find comparative research on the attributes of manuals. So, this paper aims to compare and analyze the second and third editions of the OECD Guidelines, in order to uncover the information attributes and implications of the revised version. Specifically, TF-IDF (Term Frequency-Inverse Document Frequency) was applied to understand which keywords have become more important, and Word2Vec was applied to identify keywords that were used similarly and those that were differentiated. Lastly, a 2×2 matrix was proposed, identifying the topics within each quadrant to provide a deeper comparison of the information attributes of the OECD Guidelines. This study offers a framework to help researchers understand information attributes. From a practical perspective, it appears valuable for the revision of standard manuals by domestic government agencies and corporations related to chemistry.

An Informetric Study on Academic Activities and Environmental Movements in Solving Global Environmental Problems (지구적 환경문제 해결을 위한 학술활동과 환경운동 경향 연구)

  • Park, Jae-Shin;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.27 no.3
    • /
    • pp.83-102
    • /
    • 2010
  • This study aims to understand and compare the characteristics of two major approaches to solving global environmental problems - an academic approach including scholarly activities of environmental sciences and a practical approach of environmental movements led by NGOs - by employing informetric analysis methods. Knowledge structure of environmental sciences is depicted through co-citation networks of subject categories assigned to the cited journals in the discipline of environmental sciences for the 10-year period from 2000 to 2009. Furthermore, major interests of environmental NGOs are identified on the basis of external link data collected from web sites of the NGOs. Co-word analyses are also performed using the texts of journal papers in environmental sciences as well as news articles provided by NGO sites. Through the analyses, dominant subject areas of environmental sciences and environmental movements are identified demonstrating similarities and differences between the two approaches.

Performance Evaluation of MissLess Soft Keyboard with Recommendation (추천 소프트 키보드 MissLess의 성능 평가)

  • Hwang, Kitae;Kim, Tae-Wan;Cho, Hye-Kyung
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.14 no.4
    • /
    • pp.187-195
    • /
    • 2014
  • In this paper, we evaluated the performance of recommendation and run time of the MissLess soft keyboard developed in the previous research. The MissLess keyboard assigns a hash code per each word for all words within its mobile dictionary. It decides recommendation words through three consecutive processes such as hash filtering, sorting based on spelling similarity, and finally recommendation based on frequency of use. Each process has some factors to have an impact on the recommendation success. We conducted experiments in an Android mobile device running the MissLess keyboard and measured performance of recommendation and run time overhead according to the impact factors. In this paper, we showed the experiment results.

Validating the Stability of Two-dimensional Structure of Emotion (감성 개념 이차원 구조의 안정성)

  • 김진관;문혜신;오경자
    • Science of Emotion and Sensibility
    • /
    • v.2 no.1
    • /
    • pp.43-52
    • /
    • 1999
  • 정상 성인의 경우, 감성 개념의 내적 차원 구조는 쾌/불쾌 차원과 각성/수면 차원이라는 이차원 공간상에 원형으로 분포되는 양상을 보인다고 아려져 왔다. 본 연구에서는 이와 같은 이차원 구조가 얼마나 보편적이고 일관적인가를 알아보고자 했다. 이를 위해 연구 1에서는 교차타당화를 통해 이차원 구조의 안정성을 검토했으며, 연구 2에서는 다양한 성격 특질을 지닌 집단을 선발하여 22개 단어를 짝지은 231개 쌍에 대해 유사성 평정을 시비고 다차원분석법(MDS)으로 분석한 후 이를 연구 1의 대학생 집단의 결과와 비교하였다. 연구 3에서는 낮은 발달 수준에 있는 아동 및 청소년 집단을 대상으로 연구 2와 동일한 절차를 통해 분석하였다. 연구 1, 2, 3 모두 감성 개념의 이차원 구조가 동일한 것으로 나타나 매우 안정적인 구조라는 것이 입증되었으며, 다만 아동 및 청소년의 경우 1 차원의 설명량이 정상 성인 집단보다 크고 각성/수면 차원의 설명량은 더 적었다. 이러한 결과를 통해 이차원 구조의 안정성과 일반화 가능성, 제한점, 그리고 집단의 독특한 특성을 반영하는데 이 구조적 틀을 적용할 수 있는 유용성에 대해 논의하였다.

  • PDF

Research on Words Representing Human Visual Sensibility for Residential Environment (주거환경의 시각 감성어휘 선발)

  • 윤정선;이강희;신미경;구아현
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.134-138
    • /
    • 1999
  • 본 연구는 주거환경에 대한 시각 감성을 대표하는 형용사를 선발하기 위해 수행되었다. 주거환경에 대한 감성을 대표하는 형용사를 선발하는 것은 감성의 잣대를 만드는 일이기 때문에 감성어휘를 정확하게 선택하는 것은 매우 중요하다. 어휘수집의 첫 단계에서는 주거환경 중 시각 환경에 대한 감성을 표현하는 어휘 235개를 수집하였다. 두 번째 단계에서는 수집된 어휘를 다른 피험자들에게 제시하여 주거 환경의 분위기를 나타내는 어휘로서 적절함의 정도를 7점 척도로 표시하도록 하여 24개의 어휘를 골라내었다. 세 번째 단계에서는 이들 어휘를 무선적으로 두 개씩 짝을 지어 두 단어가 유사한 정도를 7점 척도로 평가하도록 하고 이에 대해 요인분석, 군집분석, 다차원분석(MDS)을 실시하여 주거환경에 대한 10개의 감성 어휘를 추출하였다. 마지막 단계에서는 연구자들이 400여장의 실물 사진 열람을 통해 추출된 감성 어휘를 검증하여 수정하였다.

  • PDF

User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence (동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가)

  • Lee, Hyun-Woo;Han, Yo-Sub;Kim, LaeHyun;Cha, Jeung-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.79-84
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF

Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32 (TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현)

  • Chung, Ik-Joo;Chung, Hoon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.4
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

An Effcient Two-Level Hybrid Signature File Method for Large Text Databases (대용량 텍스트 데이터베이스를 위한 효율적인 2단계 합성 요약 화일 방법)

  • Yoo, Jae-Soo;Gang, Hyeong-Il
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.4
    • /
    • pp.923-932
    • /
    • 1997
  • In this paper, we propose a two-level hybrid signature file method(THM) to dffciently deal with large txt databases that use a term discrimination concept.In addition, we apply Yoo's clustering scheme to the two-level hybeid signature file method. The clustering schme groups similar signatures together according to the similarity of the highly discriminatiory tems so that we may achive better performance on retrival. The space-time ana-lyhtical model of the proposed two-level hybrid method is provided. Based on the analytical model and experiments, we compare it with the exsting methods, i.e. the bit-sliced method(BM), the-level method(TM), and the hybrid method(HM). As a result, we show that THM achives the best retrival performance in a large database with 100,000 records when the mumber fo matching records is less than 160.

  • PDF

Meeting Minutes Summarization using Two-step Sentence Extraction (2단계 문장 추출 방법을 이용한 회의록 요약)

  • Lee, Jae-Kul;Park, Seong-Bae;Lee, Sang-Jo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.20 no.6
    • /
    • pp.741-747
    • /
    • 2010
  • These days many meeting minutes of various organizations are publicly available and the interest in these documents by people is increasing. However, it is time-consuming and tedious to read and understand whole documents even if the documents can be accessed easily. In addition, what most people want from meeting minutes is to catch the main issues of the meeting and understand its contexts rather than to know whole discussions of the meetings. This paper proposes a novel method for summarizing documents considering the characteristics of the meeting minutes. It first extracts the sentences which are addressing the main issues. For each issues expressed in the extracted sentences, the sentences related with the issue are then extracted in the next step. Then, by transforming the extracted sentences into a tree-structure form, the results of the proposed method can be understood better than existing methods. In the experiments, the proposed method shows remarkable improvement in performance and this result implies that the proposed method is plausible for summarizing meeting minutes.

Korean Onomatopoeia Clustering for Sound Database (음향 DB 구축을 위한 한국어 의성어 군집화)

  • Kim, Myung-Gwan;Shin, Young-Suk;Kim, Young-Rye
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.9
    • /
    • pp.1195-1203
    • /
    • 2008
  • Onomatopoeia of korean documents is to represent from natural or artificial sound to human language and it can express onomatopoeia language which is the nearest an object and also able to utilize as standard for clustering of Multimedia data. In this study, We get frequency of onomatopoeia in the experiment subject and select 100 onomatopoeia of use to our study In order to cluster onomatopoeia's relation, we extract feature of similarity and distance metric and then represent onomatopoeia's relation on vector space by using PCA. At the end, we can clustering onomatopoeia by using k-means algorithm.

  • PDF