• 제목/요약/키워드: Web Text Analysis

검색결과 279건 처리시간 0.025초

시계열분석과 인공신경망을 이용한 실시간검색어 변화 예측 (Predicting changes of realtime search words using time series analysis and artificial neural networks)

  • 정민영
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.333-340
    • /
    • 2017
  • 실시간검색어는 지금 바로 이슈가 되는 검색어의 검색 증가율이 단기간에 급상승하는 것을 중심으로 하기 때문에 일정기간 지속적으로 관심도를 유지하고 있는 이슈를 나타내지 못하고 이들이 가까운 미래에 어떤 변화를 보이는지에 대한 것도 알 수 없는 한계를 가지고 있다. 본 논문에서는 이러한 한계를 극복할 수 있도록 일정기간 동안 상위 10위 안에 속한 적이 있는 실시간검색어에 대해 일자별, 시간별 지속성을 평가하여 꾸준히 관심을 받는 검색어를 추출한다. 그런 다음, 이들 중 상위에 속하는 검색어의 관심도가 어떻게 변화하는지를 알 수 있게 하는 시계열 분석과 신경망을 이용하는 방법을 제시하고 이를 통해 도출한 실제 예를 통해 가까운 미래의 변화량을 예측한 결과를 보인다. 일자별로는 시계열 분석을, 시간별로는 인공신경망의 학습을 통해 예측하는 것이 좋은 결과를 보인다는 것을 알 수 있다.

감성분석과 토픽모델링을 활용한 농촌태양광 관련 이슈 연구 : 언론 기사와 블로그 포스트 비교 (Application of Sentiment Analysis and Topic Modeling on Rural Solar PV Issues : Comparison of News Articles and Blog Posts)

  • 기재홍;안승혁
    • 디지털융복합연구
    • /
    • 제18권9호
    • /
    • pp.17-27
    • /
    • 2020
  • 사회적 의제 설정 영향력을 지닌 미디어인 언론 기사와 블로그 포스트에서 농촌태양광이 어떻게 다루어지고 있는지 분석하기 위해 텍스트 마이닝 방법을 활용하였다. 농촌태양광을 키워드로 웹스크래핑을 통해 기사와 블로그 포스트의 텍스트 자료를 수집하고, 이에 대해 감성분석과 토픽모델 기법을 적용하여 연구를 수행했다. 감성분석 결과 농촌태양광에 대한 텍스트에서 두 매체 모두 긍정적인 입장을 가지는 비율이 높았는데, 블로그의 경우 기사에 비해 부정적인 내용을 담은 텍스트의 비중이 훨씬 낮은 것을 확인할 수 있었다. 그리고 토픽모델링 결과로 긍정 기사는 정부의 보급계획 관련 토픽들의 비중이 컸고, 부정 기사는 다양한 토픽들의 비중이 고르게 분포하였다. 블로그는 긍정 포스트의 경우 농촌 지역 설치 관련 토픽들이, 부정 포스트는 환경 피해 관련 토픽들이 가장 큰 부분을 차지했다. 기존에 별개로 이루어지던 감성분석과 토픽모델링을 결합하는 연구 방식을 제시함으로써 농촌태양광에 대한 이슈를 효과적으로 파악할 수 있었다.

빅데이터를 활용한 생활밀착형 치유정원 연관키워드 분석 (An Analysis of Keywords Related to Neighborhood Healing Gardens Using Big Data)

  • 황지루이;이애란
    • 토지주택연구
    • /
    • 제13권2호
    • /
    • pp.81-90
    • /
    • 2022
  • 본 연구는 도심내 정신건강의 녹색치유공간의 사회적 필요성에 기인하여 생활밀착형 정원에 대한 현 시대의 사회적 인식요소 분석을 통해 발전방향을 모색하였다. 연구 방법으로 빅데이터 툴 중 덱스톰을 활용하여 웹정보 데이터를 수집하고, 텍스트마이닝을 진행하여 키워드 분석, 네트워크 분석과 담론분석을 통해 요소의 추출과 관계성을 파악하였다. 분석 결과 첫째, 치유공간과 치유환경은 도시 내부인 생활밀착의 공간 안에 친화적 건강 환경을 구축하고 있었다. 둘째, 생활밀착은 시설뿐 아니라 생활문화와 도시환경을 연동하여 국가와 지방행정, 시민이 참여하는 사업과 활동을 담고 있으며 생활밀착형 정원은 녹색복지와 서비스 프로그램을 통해 내실화되고 있다. 결론으로 정신건강에 유익하고 친근한 생활권의 공익형 정원은 긍정적 자극을 줄 수 있는 치유 환경으로서의 녹색인프라이다.

집단지성 기반 학습자료 북마킹 서비스 시스템 (Learning Material Bookmarking Service based on Collective Intelligence)

  • 장진철;정석환;이슬기;정치훈;윤완철;이문용
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.179-192
    • /
    • 2014
  • 최근 IT 환경의 변화에 따라 웹 서비스를 기반으로 대규모 사용자 대상의 상호 참여적인 MOOC(Massive Open Online Courses)과 같은 온라인 교육 환경이 부상하고 있다. 그러나 온라인 교육 시스템은 원거리로 학습이 이루어짐에 따라 학습자의 자발적 동기를 꾸준히 유지하기 어려우며, 또한 학습자 간에 지식을 공유하고 공유한 지식을 활용하는 기능이 부족하다. 이러한 문제를 극복하기 위해 구성주의적 학습이론과 집단지성에 기반하여 학습자가 보유한 학습자료를 공유하고 개인화된 학습자료 추천을 받을 수 있는 학습자료 북마킹 서비스인 WeStudy를 구현하였다. 위키피디아(Wikipedia), 슬라이드쉐어 (SlideShare), 비디오렉쳐스 (VideoLectures) 등 현존하는 집단지성 기반 서비스들의 주요 기능으로부터 필요한 집단지성 기능들을 검토하였으며, 본 서비스의 주요 기능으로 1) 리스트 및 그래프 형태의 학습자료 리스트 시각화, 2) 개인화된 학습자료 추천, 3) 보다 상세한 학습자료 추천을 위한 관심 학습자 지정 등을 도출하여 시스템을 설계하였다. 이후, 웹 기반으로 구현된 세 가지 주요기능 별로 개량된 휴리스틱 사용성 평가 방법을 통해 개발된 시스템의 사용성 평가를 실시하였다. 10명의 HCI 분야 전공자 및 현업 종사자를 대상으로 정량적 및 정성적인 평가 결과, 세 가지의 주요 기능에서 전반적으로 사용성이 우수한 것으로 판정되었다. 주요 기능 별 정성적인 평가에서 도출된 여러 마이너 이슈들을 반영할 필요가 있으며, 향후 대규모 사용자를 대상으로 본 서비스를 보급하고 이용할 수 있도록 제공하여 자발적인 지식 공유 환경을 조성할 수 있을 것으로 전망된다.

텍스트마이닝 기반의 효율적인 장소 브랜드 이미지 강도 측정 방법 (An Efficient Estimation of Place Brand Image Power Based on Text Mining Technology)

  • 최석재;전종식;비스워스 수브르더;권오병
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.113-129
    • /
    • 2015
  • 장소 브랜딩은 특정 장소에 대한 의미 부여를 통해 장소성의 정체성 및 공동가치를 생성하며 가치 창출을 하는데 중요한 활동이며, 장소 브랜드에 대한 이미지 파악을 통해 이루어진다. 이에 마케팅, 건축학, 도시건설학 등 여러 분야에서는 인상적인 장소 브랜드의 이미지를 구축하기 위하여 많은 노력을 기울이고 있다. 하지만 설문조사를 포함한 대면조사 방법은 대부분 주관적인 작업이며 측정에 많은 인력 또는 고도의 전문 인력이 소요되어 고비용을 발생시키므로 보다 객관적이면서도 비용효과적인 브랜드 이미지 조사 방법이 필요하다. 이에 본 논문은 텍스트마이닝을 통하여 장소 브랜드의 이미지 강도를 객관적이고 저비용으로 얻는 방법을 찾는 것을 목적으로 한다. 제안하는 방법은 장소 브랜드 이미지를 구성하고 있는 요인과 그 키워드들을 관련 웹문서에서 추출하며, 추출된 정보를 통해 특정 장소의 브랜드 이미지 강도를 측정하는 방법이다. 성능은 안홀트 방법에서 평가에 사용하는 전세계 50개 도시 이미지 인덱스 순위와의 일치도로 검증하였다. 성능 비교를 위해 임의로 순위를 매기는 방법, 안홀트의 설문방식대로 일반인이 평가하는 방법, 본 논문의 방법을 사용하되 안홀트의 방법으로 학습한 것으로 유의한 것으로 추정되는 평가 항목만을 반영하는 방법과 비교하였다. 그 결과 제안된 방법론은 정확성, 비용효율성, 적시성, 확장성, 그리고 신뢰성 측면에서 우수함을 보일 수 있었다. 따라서 본 연구에서 제안한 방법론은 안홀트 방식에 상호 보완적으로 사용될 수 있을 것이다. 향후에는 장소 브랜드 이미지를 형성하는 속성 별로 등장횟수를 계산 한 후에 장소 브랜드에 대한 태도, 연상, 그리고 브랜드 자산과의 인과관계를 자동으로 파악할 수 있는 부분까지 구현하고 실증적 실험을 할 예정이다.

Laparoscopic Versus Open Surgery for Rectal Cancer: A Systematic Review and Meta-analysis of Randomized Controlled Trials

  • Zhang, Feng-Wa;Zhou, Zhao-Yu;Wang, Hai-Lin;Zhang, Jv-Xia;Di, Bao-Shan;Huang, Wen-Hui;Yang, Ke-Hu
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권22호
    • /
    • pp.9985-9996
    • /
    • 2014
  • Background and Aim: Laparoscopic and open rectum surgery for rectal cancer remains controversial. This systematic review compared the short-term and long-term efficiency and complications associated with laparoscopic and open resection for rectal cancer. Materials and Methods: We searched PubMed, Embase, Cochrane Library, ISI Web of Knowledge and the China Biology Medicine Database to identify potential randomized controlled trials from their inception to March 31, 2014 without language restriction. Additional articles were identified from searching bibliographies of retrieved articles. Two reviewers independently assessed the full-text articles according to the pre-specified inclusion and exclusion criteria as well as the methodological quality of included trials. The meta-analysis was performed using RevMan 5.2. Results: A total of 16 randomized controlled trials involving 3,045 participants (laparoscopic group, 1,804 cases; open group, 1,241 cases) were reviewed. Laparoscopic surgery was associated with significantly lower intraoperative blood loss, earlier return of bowel movement and reduced length of hospital stay as compared to open surgery, although with increased operative time. It also showed an obvious advantage for minimizing late complications of adhesion-related bowel obstruction. Importantly, there were no significant differences in other postoperative complications, oncological clearance, 3-year and 5-year or 10 year recurrence and survival rates between two procedures. Conclusions: On the basis of this meta-analysis we conclude that laparoscopic surgery has advantages of earlier postoperative recovery, less blood loss and lower rates of adhesion-related bowel obstruction. In addition, oncological outcome is comparable after laparoscopic and open resection for rectal cancer.

ABCG2 C421A 다형성이 만성 골수성 백혈병 환자의 imatinib 치료에 미치는 영향: 체계적 문헌고찰 및 메타분석 (ABCG2 C421A Polymorphism and Imatinib Response in Chronic Myeloid Leukemia: A Systematic Review and Meta-Analysis)

  • 오다현;천부순
    • 한국임상약학회지
    • /
    • 제26권1호
    • /
    • pp.53-58
    • /
    • 2016
  • Objective: To estimate the association between ABCG2 C421A polymorphism and response to imatinib in chronic myeloid leukemia. Methods: A systematic review was conducted to evaluate the effect of ABCG2 C421A polymorphism on imatinib response. The databases of PubMed, Embase, Web of science, CINAHL with FullText, and Cochrane Library were searched for all published studies from inception to December 2015. The following terms were used with functions of 'AND' and 'OR': 'chronic myeloid leukemia', 'CML', 'drug transporter', 'ABCG2', 'BCRP', 'polymorphisms', 'SNPs', and 'imatinib'. The studies reporting the association between ABCG2 polymorphism and imatinib response were evaluated. Results: A total of 7 studies were included in the present meta-analysis. The pooled analysis showed that ABCG2 c.421CC genotype was significantly associated with poor response to imatinib under the dominant model (CC vs CA+AA; OR: 0.56; 95% CI: 0.41, 0.77; p = 0.0004). The subgroup analysis of Asian studies demonstrated a significantly lower response in c.421CC genotype than in c.421CA or c.421AA genotype (OR: 0.52; 95% CI: 0.37, 0.73; p = 0.0002). In subgroup analyses of 5 studies, the patients with the c.421CC genotype exhibited higher risk for worse response than the patients with c.421CA or c.421AA genotype (heterozygote codominant model: CC vs. AC; OR: 0.49, 95% CI: 0.33, 0.73; p = 0.0006; homozygote codominant model: CC vs AA; OR: 0.43; 95% CI: 0.25, 0.75, p = 0.003). Conclusion: The ABCG2 c.421CC genotype was significantly associated with poor response to imatinib compared to the c.421CA and c.421AA genotypes in chronic myeloid leukemia, especially in Asian patients.

포털사이트 실시간 검색키워드의 주간 핵심 이슈 선정 및 차이 분석 (Extracting week key issues and analyzing differences from realtime search keywords of portal sites)

  • 정민영
    • 디지털융복합연구
    • /
    • 제14권12호
    • /
    • pp.237-243
    • /
    • 2016
  • 포털사이트의 실시간 검색키워드는 검색횟수의 순간증가율이 높은 순서대로 나타나므로 짧은 시간에 관심도가 급상승하는 이슈는 쉽게 보여주지만, 포털사이트별로 다른 결과가 도출되고 일정기간에 대한 이슈는 나타내지 못하는 한계가 있다. 따라서, 일정기간 동안의 전체 실시간 검색키워드에서 핵심 이슈를 찾고 각 포털사이트별로 집계한 결과와 이들의 차이를 분석한 결과를 보여주는 것은 이슈를 보다 실제적으로 이해할 수 있는 근거를 제공하고 자주 변화하는 실시간 검색키워드에 대한 일관성을 유지할 수 있게 해준다는 측면에서 의미가 있다. 이를 위해 본 논문에서는 대표적인 두 개의 포털사이트에서 제공하는 실시간 검색키워드의 주간 분석을 통하여 주간 핵심 이슈를 추출하고 이들의 차이를 분석한다. 두 포털사이트의 실시간 검색키워드 중요도 점수에 대한 독립표본 t검정과 실시간 검색키워드 생존함수에 의한 생존분석 결과, 두 포털사이트는 차이가 있다는 것을 보였다.

오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구 (A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API)

  • 김태영;홍지원;김도희;김형종
    • 정보보호학회논문지
    • /
    • 제30권5호
    • /
    • pp.895-907
    • /
    • 2020
  • 최근 기존 텍스트 기반 콘텐츠 외 멀티미디어 콘텐츠의 영향력이 급증함에 따라 콘텐츠 내 정보들을 처리할 수 있도록 도와주는 서비스가 콘텐츠 이용에 큰 편리함을 주고 있다. 이러한 서비스의 대표적인 기능으로는 중요 정보에 대한 검색과 마스킹이 있다. 텍스트 데이터와 이미지 데이터의 검색 및 마스킹 기술을 제공해주는 솔루션들은 활발히 보급되고 있어 쉽게 접할 수 있다. 그러나 오디오 콘텐츠의 경우, 검색 및 마스킹의 필요성은 인식되지만 기술의 난이도로 인해 범용적으로 적용되는 솔루션을 찾는 것이 쉽지 않다. 본 논문은 음성 분할을 이용하여 오디오 데이터 내 정보 검색과 마스킹 기능을 제공하는 웹 애플리케이션을 제안한다. 추가적으로, 국내외 인공지능 기반 음성 인식 API에 대한 분석을 통해 적절한 API의 선택을 진행하였으며, 정규식을 이용한 개인 신상 정보의 검출 방법을 제시하였다. 마지막으로 구현결과의 정확도를 측정하여 성능을 검증하였다. 본 논문의 기여점은 오디오 데이터 내 특정 패턴의 검출 및 마스킹 기능을 설계하고 실험을 통해 검증한 것에 있다.

기업 직무 정보를 활용한 OOPP(Optimized Online Portfolio Platform)설계 (A Design of the OOPP(Optimized Online Portfolio Platform) using Enterprise Competency Information)

  • 정보근;박진욱;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.493-506
    • /
    • 2018
  • 본 논문에서는 직무별로 취업에 필요한 역량을 나타내고, 구직자가 온라인상에서 포트폴리오를 효율적으로 작성하고 관리하는 OOPP(Optimized Online Portfolio Platform)를 제안한다. 제안하는 OOPP는 세 가지 모듈로 구성된다. 첫째, JDCM(Job Data Collection Module)은 직업정보 사이트의 구인 광고들을 수집하여 스프레드시트에 저장한다. 둘째, CSM(Competency Statistical Medel)은 수집한 구인 광고들을 텍스트 마이닝하여 직무별로 요구되는 핵심 역량을 분류한다. 셋째, OBBM(Optimize Browser Behavior Module)은 브라우저의 처리속도를 개선하여 사용자가 데이터를 빠르게 조회할 수 있게 한다. OBBM은 검색엔진의 연산을 최적화하는 PSES(Parallel Search Engine Sub-Module)과 이미지 텍스트 등의 로드를 최적화하는 OILS(Optimized Image Loading Sub-Module)로 구성된다. 제안하는 OOPP의 성능분석 결과 CSM로 분석된 데이터의 정확도는 최대 100%, 최소 99.4%로 실제 광고와 분석된 데이터의 차이가 거의 발생하지 않았으며, OBBM을 이용한 브라우저 최적화를 실행하면, 작업시간이 약 68.37%가 감소한다. 결과적으로 OOPP는 직현재 직업정보 사이트의 구인 광고를 정확하게 분석하여 사용자가 분석한 결과를 웹페이지에서 신속하게 조회할 수 있다.