• 제목/요약/키워드: school human document

검색결과 30건 처리시간 0.03초

스크럼을 활용한 소규모 소프트웨어 개발 기반의 소프트웨어 프로세스 인증 모델 (A Software Process Certification Model of Small sized Software Development Using Scrum)

  • 송인오;류성열;이성은
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.215-223
    • /
    • 2011
  • 소규모의 프로젝트에 소프트웨어 프로세스 인증 모델을 적용하기에는 참여인력 구성, 프로젝트 관리 및 품질 보증 등을 위한 활동과 문서 작성에 많은 어려움이 있다. 본 연구는 애자일 방법인 스크럼과 정보통신산업진흥원에서 제시한 SP인증 모델의 필수요소들을 결합하여 소규모 소프트웨어 개발에 적합한 소프트웨어 프로세스 인증 모델을 제시한다. 제시한 모델은 SP인증 획득에 필요한 최소한의 수행활동, 그리고 산출물을 정의하였다. 제시 모델은 16개의 프로세스와 58개의 수행활동으로 구성되며 39개의 산출물이 작성된다. 제시한 모델을 중소표준프로세스와 비교한 결과 수행활동은 38%, 작성문서는 20% 감소하여 소규모 프로젝트에서 부담이 경감되었음을 확인하였다. 그리고 제시 모델의 활용 가능성을 검증하기 위하여 2개의 소규모 프로젝트에 적용한 결과, 스크럼 프로세스만으로 진행한 프로젝트와 비교하여 추가인원 없이 체계적인 관리를 할 수 있었고, 정해진 기간 안에 프로젝트를 완료하였으며 SP인증 2등급 획득하여 그 유용성을 검증하였다.

A Method for Safety of RFID Systems

  • Karygiannis, Tom;Eydt, Bernard;Barber, Greg;Bunn, Lynn;Phillips, Ted
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.63-70
    • /
    • 2008
  • The authors, Tom Karygiannis of NIST, and Bernard Eydt, Greg Barber, Lynn Bunn, and Ted Phillips of Booz Allen Hamilton, wish to thank Steven Fick, Rick Korchak, Kate Remley, Jeff Guerrieri, Dylan Williams, Karen Scarfone, and Tim Grance of NIST, and Kenneth Waldrop and Beth Mallory of Booz Allen Hamilton. These individuals reviewed drafts of this document and contributed to its technical content. The authors would also like to express their thanks to several experts for their critical review and feedback on drafts of the publication. These experts include V.C. Kumar of Texas Instruments; Simson Garfinkel of the Naval Postgraduate School; Peter Sand of the Department of Homeland Security; Erika McCallister of MITRE; and several professionals supporting Automatic Identification Technology(AIT) program offices within the Department of Defense(DoD), especially Nicholas Tsougas, Fred Naigle, Vince Pontani, Jere Engelman, and Kathleen Smith. During the public comment period we received helpful comments from the following Federal Government agencies: the US Departments of Defense, Health and Human Services, Homeland Security, Labor, and State; the Office of the Director of National Intelligence; the Office of Management and Budget; and the General Services Administration. We also received several helpful contributions from commercial industry, including comments from EPCglobal, VeriSign, and Priway. Finally, the authors wish to thank the following individuals for their comments and assistance: Brian Tiplady, Daniel Bailey, Paul Dodd, Craig K. Harmon, William MacGregor, Ted Winograd, Russell Lange, Perry F. Wilson, John Pescatore, Ronald Dugger, Stephan Engberg, Morten Borup Harning, Matt Sexton, Brian Cute, Asterios Tsibertzopoulos, Mike Francis, Joshua Slob in, Jack Harris, and Judith Myerson.

  • PDF

한국의 전침연구 동향 분석 (An Overview of Electroacupuncture Research Trend in Korea)

  • 권선오;이정원;김승태
    • Korean Journal of Acupuncture
    • /
    • 제35권3호
    • /
    • pp.123-129
    • /
    • 2018
  • Objectives : Electroacupuncture is a procedure in which pulses of weak electrical current are sent through acupuncture needles into acupuncture points in the skin. Since the 1970s, electroacupuncture has been widely used for treating various diseases including pain, inflammatory diseases and neurodegenerative diseases and electroacupuncture research has also been actively conducted in Korea. This study was designed to assess the tendencies and research performances in Korea. Methods : Articles referring to electroacupuncture in Korea were searched in Korean Studies Information Service System, Oriental Medicine Advanced Searching Integrated System, DBpia, Pubmed and Scopus, and assessed by distribution of document types, published articles, source institutes, journals, and subject categories. Results : Total 677 articles were included in this study. Among them, basic researches were 395, clinical researches were 210, reviews were 68 and others were 4. Kyung Hee university published the most articles, followed by Wonkwang univresity, Daejeon university and Pusan national university in Korean institutes. Journal of Acupuncture Research published the most articles, followed by Korean Journal of Acupuncture, Journal of Korean medicine rehabilitation and Journal of physiology & pathology in Korean medicine among journals. Animals were used in the most articles, followed by human, literatures and protocol in subject categories. The number of articles per year was related to the increase of research fund and the number per institution was related to the number of professors and researchers. Conclusions : In order to carry out better electroacupuncture researches, it is necessary to cultivate electroacupuncture researchers and increase in research funds.

스마트 디바이스를 활용한 교육시설물 자원관리 시스템에 관한 연구 (A Study on Educational Facilities Resource Management System using Smart Devices)

  • 류창수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1013-1014
    • /
    • 2015
  • 현재 교육시설은 학교시설관리기준에 의거한 엄격한 적용과 예방교육을 함에도 불구하고 학교 안전사고는 책임의식이 매우 낮은 미성년학생들에 의한 우발적 사고와 화재 및 시설물에 관한 안전 불감증으로 인해 인적 물적 피해가 발생하고 있다. 교육시설 안전을 위해서는 신속한 업무 처리와 현장에서 손쉽게 교육시설물에 관한 전자도면 및 관련문서들을 스마트 디바이스를 통하여 다양한 방법으로 확인 할 수 있도록 하는 기술이 요구되고 있다. 본 논문에서는 안전사고 발생시 전자도면, 문서관리, 다양한 교육시설물 문서 등을 다양한 스마트 디바이를 통한 교육시설물 자원관리 시스템(EFRMS)으로 교육시설의 점검과 통제를 할 수 있도록 문서변환 기능과 해상도 고효율화, 사물인터넷(IoT) 기술를 활용하여 교육업무시스템(NEIS)과 연계한 시스템 설계를 제안하였다.

  • PDF

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

개인 일기의 연구 자료로서의 가치와 전망 "5월12일 일기컬렉션"을 중심으로 (Value and Prosect of individual diary as research materials : Based on the "The 12th May Diaries Collection")

  • 최효진;임진희
    • 기록학연구
    • /
    • 제46호
    • /
    • pp.95-152
    • /
    • 2015
  • 일상아카이브란 '보통사람들'의 삶과 문화를 구체화, 범주화하여 이에 따라 개인이나 공동체, 더 나아가 한 사회의 기억과 이를 담은 기록물을 수집, 평가, 선별, 보존하는 조직이나 시설, 장소를 말한다. 일기를 비롯해 자서전, 회고록, 편지, 메모 등 실물자료와 온라인 공간에서 주고받는 블로그나 카페 게시물, SNS에 업로드되는 일상의 사진도 여기에 속한다. 이렇게 매 순간 생산되는 일상기록의 수집과 보존에 관한 필요성이 기록학계를 비롯해 다양한 분야에서 제기되고 있다. 특히 일기는 시대를 불문하고 한 개인이 매일같이 경험한 사실과 자아성찰 등을 정리한 글로서 기록의 원천성과 개별성, 유일성 등의 가치가 크게 중요시 되고 있다. 최근 여러 편의 일기들이 발굴, 소개되면서 역사학을 비롯해 다양한 인문사회과학 분야에서도 일기와 기록주체, 생산된 시대 연구가 이루어져왔다. 또한 언어학, 교육학, 심리학 등의 분야에서는 일기에서 관찰되는 언어습관, 문화수용양상, 저자의 감정이나 심리변화 등을 분석한다. 이 글에서는 국내외에서 이루어지는 일기 관련 연구 동향을 정리하고 이 맥락에서 일상기록으로서 "5월12일 일기컬렉션"이 갖는 의미를 찾는다. "5월12일 일기컬렉션"은 매년 5월12일 시민들이 직접 생산, 기증한 일기로 구성되어 있다. 명지대 디지털아카이빙연구소가 2013년 첫 '5월12일 일기수집 이벤트'를 개최한지 3년이 되는 현재 유치원생부터 80대 참가자들이 육필 (그림)일기, 전자문서, 디지털사진/영상, 음성녹음 등 다양한 유형으로 생산된 일기가 2천여 건 수집되었다. 이 글에서는 이렇게 수집된 일기를 정량적으로 분석하고 개별 기록물들이 어떤 내용을 담고 있는지를 살펴본다. 가족, 친구, 학교생활, 진로고민 등 연령별 지역별 직업별로 시민들의 생활상과 진솔한 고민을 읽을 수 있다. 개별 기록물에서 추출되는 키워드와 주제어에 따라 이 일기들이 담고 있는 주제를 더욱 포괄적으로 살펴보고자 한다. 또한 수집된 일기들을 형식과 내용에 따라 연구자료로 언어학, 교육학을 비롯해 역사학, 인류학 등 다양한 학문 분야에서 어떻게 활용될 수 있을지 그 연구 가능성을 제언해본다. 그리고 "5월12일 일기컬렉션"이 일상아카이브로서 수집, 보존되기 위해 필요한 과제가 무엇인지 살펴본다.

한국에서의 건강영향평가 도입 방안 (Introduction Scheme of Health Impact Assessment in Korea)

  • 김임순;한영한;한상욱
    • 환경영향평가
    • /
    • 제16권6호
    • /
    • pp.511-524
    • /
    • 2007
  • Korea has 30 years of experiences in environmental impact assessment (EIA). Although EIA includes sanitation-public health factor, considering health impacts, among 74 unit projects of 17 sections, health impacts haven't been properly considered or have been ignored in many cases. The increasing awareness on the importance of health impacts has triggered this study to seek an optimal introduction scheme of health impact assessment (HIA). The processes of EIA already include screening, scoping, analysis, impact assessment, consultation, document review, decision making and monitoring, in which they would be the essential parts of HIA. In this context, integrating HIA into the existing EIA process could be the most effective way to use the benefits in both legal and procedural processes existed and to avoid the confusion and overlapping since the close relationships between environment and health impacts might be. Furthermore, it is desirable that the existing sanitation-public health factor should be substituted by and extended to environment-health factor with sufficient determinants to properly consider health impacts. When considering the first step of HIA, the prospective and qualitative approach is suitable more than the retrospective and quantitative one due to the lack of database accumulated. Similarly, an approach based on epidemiology and toxicology could analyze the limited evidences and impacts related to human disease, whereas one based on socio-science and psychology could provide the effective means available for predicting how the people and community will act by the change of surroundings. Checklist approach with various and comprehensive health determinants focused on prospective and qualitative methods will be very useful for more convenient and progressive dissemination of HIA. Various checklist approaches of toolkits could be found from HIA documents elsewhere, for example Westminster Toolkit, and they would be helpful to figure out how to develop common procedures and health determinants for checklist, in which the unique characteristics on korean cultural and political context compared to abroad should be carefully considered since checklist would be the most basic and essential part of HIA. After the establishment of checklist and procedural processes, the pilot projects should be conducted. Main purpose of pilot projects is to apparently prove the effectiveness and profitability of HIA. Pilot projects should be implemented to decide the effectiveness and suitability of HIA for future projects, programs and policies, and should be provided as the positive cases that can be achieved through the proper implementation and progress.

사무 자동화에 따른 사무직 근로자의 건강과 연관된 자각 증상에 대한 조사연구 (An Investigation on the self-consciousness Symptoms of the Clerical Workers attendant upon Office Automation)

  • 정미화
    • 한국직업건강간호학회지
    • /
    • 제3권호
    • /
    • pp.54-70
    • /
    • 1993
  • According as the automation of clerical work(OA ; Office Automation) develops, the use of VDT(Visual or Video Display Terminal) is increasing suddenly. But, in proportion to the spread of office automation(OA tendency), the self-conciousness syptom attendant upon the work is appearing also (Kim, Jung Tae, Lee, Young Ook, 1990). The apparatuses of office enable the clerical workers to be convenient and perform mass businesses. But, they are increasing the opportunity to be exposed to VDT syndrom, techno stress, computer terminal disease, pain by muscle strain(RSI), bradycausia of noise nature, and electromagnetic waves, etc. which are referred to as the new type of occupational diseases to the workers. It is the real situation that the workers to use VDT is complaining of the physical inconvenience sense in the recent newspaper and literature, it is the point of time that the sydrome to come from VDT use and computer terminal disease, etc. must be classified into the occupational disease(Lee, Kwang Young 1990, Lee, Kyoo Hak 1990, Lee, Won Ho 1991, Lee, Si Young 1991, Lee, Joon 1991, Choi, Young Tae 1991, Heo, Seung Ho 1989). In addition, it is the real situation that the scientifitic study result about the scope that electromagnetic waves has influence on the human body has not been suggested yet, and criticism on the stable exposure permission standard about electromagnetic waves to be emitted from VDT and on the problem in the health about electromagnetic waves is continuing. (IEEE Spectrum, 1990). In addition according to the experience of nursery business of industry field, it is the real situation that the patients who consult complaining of physical and mental inconvenience sence, among the users of apparatus of office automation, are reaching 10% of the patients coming to doctor's room. Therefore, it is necessary to confirm the self-consciousness symptom that the clerical workers complain of multilaterally with the actual state examination about the use of the apparatuses of offices automaton. Thus, this study was tried as th basic data for the cosultation and education for the maintenance and furtherance of the health of workers as the nurse of industry field, by confirming the contents of self-consciousness symptom attendant upon the use of the apparatus for office outomation making the financial institution in which the spparatus for office automation in most frequently used as the subject, and by examining whether there is the difference according to the subject of study, the data were collected, by using the questionnaire method, making 200 workers who consented to the study participation as the subject, among the persons who have spent over 3 months since they used the apparatuses for office automation and didn't receive the treatment in hospital due to the clerical disease for recent 3 years. The period of data collection was from Oct. 9, 1991 to Oct. 12. As for the measurement instrument about the complaint if self-consciousness symptom attendant upon the use of apparatuses fo office automation, the question item on the complaint symptom of health problem attendant upon the treatment of VDT that Kim(1991) developed and on CMI health problem and the question items on the fatigue degree due to industry were used by previous examination to 25 persons. Collected data were analyzed with the statistical method such as percentage, arithmetic mean, Person correlation coeffient, Kai square verfication, t-test, ANOVA, etc. by using SPSS/PC+ program, and the result is as follows : 1. The self-consciousness symptom that the clerical workers complained of most frequetly appeared high in 'My eyes are tired'(99.4%), 'I feel fatigue and weariness'(99.4%), 'I feel that my head is heavy5(90.0%), 'eyesight fell'(88.8%), 'I have a stiff neck'(88.8%), 'I fell pain in the shoulder'(85.0%), 'I feel cold and painful in the eyes'(76.9%), 'I feel the dry sense of eyeball'(76.2%), 'My nerves are edgy, and I an fretful, (75.6%), 'I feel pain in the waist'(73.2%) and 'I fell pain in the back'(72.8%). It emerged that the subject use the apparatuses for office automation complained of self-consciousness symptoms related to visual symptoms and musculoskeletal symptoms. 2. As for the general feature of examination subjects, the result to see the distribution by classifying into sex, age, school career, use career of apparatuses for office automation, skillfulness degree of the use of apparatus for office automation, use hours of the apparatuses for office automation per 1 day, type of business of the apparatus for office automation, rest hours during the use of apparatus for office automation, satifaction degree of business of office automation, and work circumstance, etc. emerged as follows : As for the sex of subjects, the distribution showed that men were 58.8% and women were 41.3%, Age was average 26.9. As the distribution of school career, the distribution showed that4below the graduation of high school' was 58.8%, 'graduation from junior college-university' was 35.0%, and 'over graduate school' was 6.3%. In the question to ask the existence or non-existence of experience of health consultation in connection with the work of office automation, the response that I had the consultation exprience and I feel the necessity emergerd as 90.1% And, the case that the subject who didn't wear the glasses or lens before using the OA apparatus wear glasses or lens after using OA apparatus emerged as 28.3% of whole. As for the existence or non-existence of use career of OA apparatus, the case under 3 years was highest as 52. 7%. As for the skillfulnness degree about the use of apparatus for office automation, most of them are skillful with the fact that 'common' was 44.4%, 'skill' was 42.5%, and 'unskillful' was 13.1% As for the use average hours of the apparatus for office automation per 1 day, the distribution showed that the case under 3-6 hours was 33.1%, the case under 6-9 hours was 28.1%, the case under 3 hours was 30.6%, and the case over 9 hours was 8.1% Main OA business and the use hours for 1 day showed in the order of keeping and retrieval, business of information transmission(162min), business of information transmission(79.3 min), business of document framing(55.5 min), and business of duplication and printing(25.4min). as for the rest during the use of apparatus for affice automation, that I take rest occasion demands the major portion, but that I take after completing the work emerged as 33.8%. Though the subiness gets to be convenient by the use of the apparatus for of office automation, respondents who showed the dissatisfaction about the present OA business emergd high as 78.1%. The work circumstances of each office was good with the fact that the temperature of office was 21.8, noise was average 42.7db, and the illumination was average 364.4 lx, in the light of ANSi/HFS 100 Standard. 3. Sight syptom, musculoskeletal symptom, skin and other symptoms showed the significant difference according to the extent of skillfulness of the apparatus for office automation. All the symptoms exept skin symptom showed the difference according to the use hours of the apparatus for office automation. All the question items exept the sytoms of digestive organs and the rest hours during the apparatus for office automation showed the signicant difference. The question item which showed the signicant difference from the satisfaction degree of present OA business showed the significant difference from all the question item classified into 6 groups. But, age and school career didn't significant difference from the complaint of any self-consciousness symptoms.

    . In conclusion, the self-consciousness symptoms of the subjects to use OA apparatus appeared differently, according to sex distiction, skillfull degree of OA apparatus, use hours of OA apparatus, the rest hours during th use of OA apparatus, and the satiafaction degree of persent business. Therefore, it is necessary that the nurse in the inuctry field must recognize to receive the education about the human technological physical condition which is most proper for te use of OA apparatus and about the proper rest method until they get accustomed to the use of OA apparatus. In addition, the simple exercise relax the tention of muscle due to the repetitive simple movement, and the education for the protection of eyesight are necessary.

  • PDF
  • 호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

    • 문현실;성다윗;김재경
      • 지능정보연구
      • /
      • 제25권1호
      • /
      • pp.21-41
      • /
      • 2019
    • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

    사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

    • 정다미;김재석;김기남;허종욱;온병원;강미정
      • 지능정보연구
      • /
      • 제19권3호
      • /
      • pp.1-23
      • /
      • 2013
    • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).