• 제목/요약/키워드: Web Text Analysis

검색결과 283건 처리시간 0.031초

포털사이트 실시간 검색키워드의 주간 핵심 이슈 선정 및 차이 분석 (Extracting week key issues and analyzing differences from realtime search keywords of portal sites)

  • 정민영
    • 디지털융복합연구
    • /
    • 제14권12호
    • /
    • pp.237-243
    • /
    • 2016
  • 포털사이트의 실시간 검색키워드는 검색횟수의 순간증가율이 높은 순서대로 나타나므로 짧은 시간에 관심도가 급상승하는 이슈는 쉽게 보여주지만, 포털사이트별로 다른 결과가 도출되고 일정기간에 대한 이슈는 나타내지 못하는 한계가 있다. 따라서, 일정기간 동안의 전체 실시간 검색키워드에서 핵심 이슈를 찾고 각 포털사이트별로 집계한 결과와 이들의 차이를 분석한 결과를 보여주는 것은 이슈를 보다 실제적으로 이해할 수 있는 근거를 제공하고 자주 변화하는 실시간 검색키워드에 대한 일관성을 유지할 수 있게 해준다는 측면에서 의미가 있다. 이를 위해 본 논문에서는 대표적인 두 개의 포털사이트에서 제공하는 실시간 검색키워드의 주간 분석을 통하여 주간 핵심 이슈를 추출하고 이들의 차이를 분석한다. 두 포털사이트의 실시간 검색키워드 중요도 점수에 대한 독립표본 t검정과 실시간 검색키워드 생존함수에 의한 생존분석 결과, 두 포털사이트는 차이가 있다는 것을 보였다.

오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구 (A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API)

  • 김태영;홍지원;김도희;김형종
    • 정보보호학회논문지
    • /
    • 제30권5호
    • /
    • pp.895-907
    • /
    • 2020
  • 최근 기존 텍스트 기반 콘텐츠 외 멀티미디어 콘텐츠의 영향력이 급증함에 따라 콘텐츠 내 정보들을 처리할 수 있도록 도와주는 서비스가 콘텐츠 이용에 큰 편리함을 주고 있다. 이러한 서비스의 대표적인 기능으로는 중요 정보에 대한 검색과 마스킹이 있다. 텍스트 데이터와 이미지 데이터의 검색 및 마스킹 기술을 제공해주는 솔루션들은 활발히 보급되고 있어 쉽게 접할 수 있다. 그러나 오디오 콘텐츠의 경우, 검색 및 마스킹의 필요성은 인식되지만 기술의 난이도로 인해 범용적으로 적용되는 솔루션을 찾는 것이 쉽지 않다. 본 논문은 음성 분할을 이용하여 오디오 데이터 내 정보 검색과 마스킹 기능을 제공하는 웹 애플리케이션을 제안한다. 추가적으로, 국내외 인공지능 기반 음성 인식 API에 대한 분석을 통해 적절한 API의 선택을 진행하였으며, 정규식을 이용한 개인 신상 정보의 검출 방법을 제시하였다. 마지막으로 구현결과의 정확도를 측정하여 성능을 검증하였다. 본 논문의 기여점은 오디오 데이터 내 특정 패턴의 검출 및 마스킹 기능을 설계하고 실험을 통해 검증한 것에 있다.

기업 직무 정보를 활용한 OOPP(Optimized Online Portfolio Platform)설계 (A Design of the OOPP(Optimized Online Portfolio Platform) using Enterprise Competency Information)

  • 정보근;박진욱;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.493-506
    • /
    • 2018
  • 본 논문에서는 직무별로 취업에 필요한 역량을 나타내고, 구직자가 온라인상에서 포트폴리오를 효율적으로 작성하고 관리하는 OOPP(Optimized Online Portfolio Platform)를 제안한다. 제안하는 OOPP는 세 가지 모듈로 구성된다. 첫째, JDCM(Job Data Collection Module)은 직업정보 사이트의 구인 광고들을 수집하여 스프레드시트에 저장한다. 둘째, CSM(Competency Statistical Medel)은 수집한 구인 광고들을 텍스트 마이닝하여 직무별로 요구되는 핵심 역량을 분류한다. 셋째, OBBM(Optimize Browser Behavior Module)은 브라우저의 처리속도를 개선하여 사용자가 데이터를 빠르게 조회할 수 있게 한다. OBBM은 검색엔진의 연산을 최적화하는 PSES(Parallel Search Engine Sub-Module)과 이미지 텍스트 등의 로드를 최적화하는 OILS(Optimized Image Loading Sub-Module)로 구성된다. 제안하는 OOPP의 성능분석 결과 CSM로 분석된 데이터의 정확도는 최대 100%, 최소 99.4%로 실제 광고와 분석된 데이터의 차이가 거의 발생하지 않았으며, OBBM을 이용한 브라우저 최적화를 실행하면, 작업시간이 약 68.37%가 감소한다. 결과적으로 OOPP는 직현재 직업정보 사이트의 구인 광고를 정확하게 분석하여 사용자가 분석한 결과를 웹페이지에서 신속하게 조회할 수 있다.

1기 신도시의 도시 성장 과정 고찰 - 텍스트마이닝을 이용한 신문기사의 키워드 네트워크 분석을 중심으로 - (Examining the Urban Growth Process of the 1st New Town -Focusing on the Keyword Network Analysis of Newspaper Articles using Text Mining-)

  • 정다은;김충호
    • 지역연구
    • /
    • 제39권4호
    • /
    • pp.91-110
    • /
    • 2023
  • 본 연구의 목적은 신문기사를 통해 건설 이후 약 34년 동안 1기 신도시의 도시 성장 과정에서 발생한 도시 이슈를 탐색하는 것이다. 이를 위해, 웹크롤링 기법을 활용하여 1기 신도시 관련 신문기사를 수집하고, 텍스트마이닝 기법을 토대로 내용분석을 진행하였다. 주요 연구 결과는 다음과 같다. 첫째, 1기 신도시 건설 초기에는 생활인프라, 부동산, 교통, 도시개발 및 정비, 안전, 주택 공급의 6개 부문에서 이슈가 다양하게 나타났으나, 점차 부동산과 도시개발 및 정비로 좁혀졌다. 둘째, 신도시 건설단계 및 도시 안정화 단계에서는 '서울시'를 중심으로 한 네트워크 구조가 유지되었는데, 이는 1기 신도시가 지리적으로 서울 근교에 건설되면서 발생한 이슈에 대해 서울과 비교하는 기사가 다수 나타났기 때문으로 볼 수 있다. 셋째, 도시 노후화에 대한 이슈는 준공 후 10년부터 나타났으며, 준공 후 30년의 시점부터는 도시 노후화에 따른 도시 재정비에 대한 논의가 본격화되었다. 본 연구는 1기 신도시의 도시 성장 과정 전반에서 발생한 이슈를 탐색하였으며, 1기 신도시 재정비 방안 마련에 기초자료로써 활용될 수 있다는 데에 연구의 의의가 있다.

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

스토리텔링을 활용한 호남지역 장수밥상 콘텐츠 개발 - 전북 진안·전남 구례군 중심으로 - (Development of Local Food Content in Jinan-Gun and Gurye-Gun through Storytelling)

  • 김미혜;정혜경
    • 한국식생활문화학회지
    • /
    • 제28권2호
    • /
    • pp.145-157
    • /
    • 2013
  • The purpose of this study was to develop cultural food contents from local dishes related to the historical and cultural heritage in the representative areas of Gurye and Jinan. The information on 'Story' was collected from each region's representative local native journal, searches of related web-sites, analysis of old literature, and interviews of traditional households. 'Telling', the conveyance, was focused on texts of literature analysis, which were synthesized from historical conditions, regional food materials, cuisine, regional symbolism, etc. The created food contents were displayed with balanced and healthy Korean food dishes after nutritional analysis. In Gurye, the content was extracted from the story of Hwang hyun (黃玹, 1855-1910) - figura of Gurye - and his collection, "Maecheonyarok", and the storytelling native food was prepared. In Jinan, the content was extracted from the text of an anecdote from "filial son Kwang-beom Lee", a local journal. We tried to express Gurye's clean image in connection with the patriot - Hwang hyun (his nick name was Maecheon), in the late period of Chosun through the unprocessed and simple nature of the dining table. As in Jinan's storytelling materials, we tried to express a healthy menu of health food for older people based on the clean nature and documents about the real character's filial behavior. The developed healthy menu and dining table properties in this study have been established in accordance with nutrient intake standards of energy in Korea.

Effectiveness of miniscrew assisted rapid palatal expansion using cone beam computed tomography: A systematic review and meta-analysis

  • Siddhisaributr, Patchaya;Khlongwanitchakul, Kornkanok;Anuwongnukroh, Niwat;Manopatanakul, Somchai;Viwattanatipa, Nita
    • 대한치과교정학회지
    • /
    • 제52권3호
    • /
    • pp.182-200
    • /
    • 2022
  • Objective: This study aims to examine the effectiveness of miniscrew assisted rapid palatal expansion (MARPE) treatment in late adolescents and adult patients using cone-beam computed tomography (CBCT). Methods: Literature search was conducted in five electronic databases (PubMed, Embase, Scopus, Web of Science, and Cochrane Library) based on the PICOS keyword design focusing on MARPE. Out of the 18 CBCT screened outcomes, only nine parameters were sufficient for the quantitative meta-analysis. The parameters were classified into three main groups: 1) skeletal changes, 2) alveolar change, and 3) dental changes. Heterogeneity test, estimation of pooled means, publication bias, sensitivity analysis and risk of bias assessment were also performed. Results: Upon database searching, only 14 full-text articles were qualified from the 364 obtained results. Heterogeneity test indicated the use of the random-effects model. The pooled mean estimate were as follows: 1) Skeletal expansion: zygomatic width, 2.39 mm; nasal width, 2.68 mm; jugular width, 3.12 mm; and midpalatal suture at the posterior nasal spine and anterior nasal spine, 3.34 mm and 4.56 mm, respectively; 2) Alveolar molar width expansion, 4.80 mm; and 3) Dental expansion: inter-canine width, 3.96 mm; inter-premolar width, 4.99 mm and inter-molar width, 5.99 mm. The percentage of expansion demonstrated a skeletal expansion (PNS) of 55.76%, alveolar molar width expansion of 24.37% and dental expansion of 19.87%. Conclusions: In the coronal view, the skeletal and dental expansion created by MARPE was of the pyramidal pattern. MARPE could successfully expand the constricted maxilla in late adolescents and adult patients.

토픽 모델링을 활용한 광범위 선천성 대사이상 신생아 선별검사 관련 온라인 육아 커뮤니티 게시 글 분석: 계량적 내용분석 연구 (Analysis of online parenting community posts on expanded newborn screening for metabolic disorders using topic modeling: a quantitative content analysis)

  • 이명선;정현숙;김진선
    • 여성건강간호학회지
    • /
    • 제29권1호
    • /
    • pp.20-31
    • /
    • 2023
  • Purpose: As more newborns have received expanded newborn screening (NBS) for metabolic disorders, the overall number of false-positive results has increased. The purpose of this study was to explore the psychological impacts experienced by mothers related to the NBS process. Methods: An online parenting community in Korea was selected, and questions regarding NBS were collected using web crawling for the period from October 2018 to August 2021. In total, 634 posts were analyzed. The collected unstructured text data were preprocessed, and keyword analysis, topic modeling, and visualization were performed. Results: Of 1,057 words extracted from posts, the top keyword based on 'term frequency-inverse document frequency' values was "hypothyroidism," followed by "discharge," "close examination," "thyroid-stimulating hormone levels," and "jaundice." The top keyword based on the simple frequency of appearance was "XXX hospital," followed by "close examination," "discharge," "breastfeeding," "hypothyroidism," and "professor." As a result of LDA topic modeling, posts related to inborn errors of metabolism (IEMs) were classified into four main themes: "confirmatory tests of IEMs," "mother and newborn with thyroid function problems," "retests of IEMs," and "feeding related to IEMs." Mothers experienced substantial frustration, stress, and anxiety when they received positive NBS results. Conclusion: The online parenting community played an important role in acquiring and sharing information, as well as psychological support related to NBS in newborn mothers. Nurses can use this study's findings to develop timely and evidence-based information for parents whose children receive positive NBS results to reduce the negative psychological impact.

소셜미디어 분석을 통한 삭카린나트륨 소비자 인식 조사 (Consumers Perceptions on Sodium Saccharin in Social Media)

  • 이수연;이원성;문일철;권훈정
    • 한국식품위생안전성학회지
    • /
    • 제30권4호
    • /
    • pp.329-342
    • /
    • 2015
  • 본 연구에서는 소셜미디어 콘텐츠를 소프트웨어 시스템을 이용하거나 정성적으로 분석함으로써 삭카린나트륨에 대한 소비자 인식도를 조사하고자 하였다. 첫 번째로, 1년(2013.7~2014.6)의 기간 동안 네이버와 카페에서 작성된 글들을 수집하였으며, 수집된 글들은 무료 텍스트 분석 소프트웨어인 TONK를 사용하여 분석되었다. 블로그와 카페에서 작성된 글들은 주로 삭카린나트륨을 사용하지 않은 제품에 대한 것으로 파악되었으며, 기타 높은 단맛과 낮은 열량을 보이는 삭카린나트륨의 특성, 식품첨가물 제거법에 대한 내용이 있는 것으로 파악되었다. 두 번째로, 네이버 트렌드 검색 서비스를 이용하여 삭카린나트륨에 대한 검색량 증가 구간에 발생한 언론보도 사건을 조사하였다. PC 검색량의 경우 총 11개 증가 구간 중 6개의 구간에서, 모바일 검색량의 총 12개 증가 구간 중 8개의 구간에서 뉴스에서 삭카린나트륨 사용허용 품목 확대에 대해 보도한 것으로 나타났다. 세 번째로 식품의약품안전처의 삭카린나트륨 사용 허용품목 확대 발표를 보도한 연합뉴스의 댓글을 분석하였다. 공감수 100개 이상인 댓글의 내용을 분석 결과 정부 불신을 비판하는 댓글들이 가장 많았으며, 그 외 관련 제품의 가격 비판 댓글과 기업 불신을 드러내는 댓글들이 파악되었다. 시판 제품들의 표시사항 분석 결과, 삭카린나트륨을 첨가하지 않은 제품들은 삭카린나트륨 무첨가라는 표시를 강조하고 있는 것으로 조사되었다. 본 연구 결과 소비자들은 삭카린나트륨의 사용 확대에 관심이 있으며, 사용 확대 보도시에 검색량이 증가하였다. 따라서, 매체들은 삭카린나트륨 사용 확대에 관하여 보도를 할 때에 과학적인 근거에 바탕하여 확대배경이나 적정 섭취량 등을 함께 알리는 것이 소비자의 올바른 인식에 도움을 줄 것이다.

실시간 검색어 연관 분석을 통한 핵심 이슈 선정 (Selecting a key issue through association analysis of realtime search words)

  • 정민영
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.161-169
    • /
    • 2015
  • 포털 사이트의 실시간 검색어는 현재 관심이 급상승하고 있는 이슈를 보여주기 위해 주로 검색횟수가 많은 순서에 따라 몇 초 간격으로 제공되고 있다. 그렇지만 너무 짧은 시간 내에 순위가 바뀌는 실시간 검색어의 특성 때문에 하루의 핵심 이슈를 비켜가는 문제가 발생한다. 본 논문에서 이러한 문제를 보완하기 위해 검색어들 사이의 연관 분석을 통하여 검색어들이 관련된 핵심 이슈를 도출하는 방법을 제안하고자 한다. 이를 위해 먼저 실시간 검색어를 순위와 상대적 관심도를 기반으로 점수화하여 집단별 기술통계를 통해 최상위 10개의 검색어를 도출한다. 그 다음으로 지지도와 신뢰도를 기반으로 연관 규칙을 추출하고 이를 가시화하는 그래프 결과를 바탕으로 핵심 이슈를 선정한다. 실험 결과는 단일 최상위 실시간 검색어보다 연관분석을 통해 높은 점수로 선정된 핵심 이슈가 더 큰 의미를 갖는다는 것을 보여준다.