• 제목/요약/키워드: Web Text Analysis

검색결과 279건 처리시간 0.028초

Perceptions of Residents in Relation to Smartphone Applications to Promote Understanding of Radiation Exposure after the Fukushima Accident: A Cross-Sectional Study within and outside Fukushima Prefecture

  • Kuroda, Yujiro;Goto, Jun;Yoshida, Hiroko;Takahashi, Takeshi
    • Journal of Radiation Protection and Research
    • /
    • 제47권2호
    • /
    • pp.67-76
    • /
    • 2022
  • Background: We conducted a cross-sectional study of residents within and outside Fukushima Prefecture to clarify their perceptions of the need for smartphone applications (apps) for explaining exposure doses. The results will lead to more effective methods for identifying target groups for future app development by researchers and municipalities, which will promote residents' understanding of radiological situations. Materials and Methods: In November 2019, 400 people in Fukushima Prefecture and 400 people outside were surveyed via a web-based questionnaire. In addition to basic characteristics, survey items included concerns about radiation levels and intention to use a smartphone app to keep track of exposure. The analysis was conducted by stratifying responses in each region and then cross-tabulating responses to concerns about radiation levels and intention to use an app by demographic variables. The intention to use an app was analyzed by binomial logistic regression analysis. Text-mining analyses were conducted in KH Coder software. Results and Discussion: Outside Fukushima Prefecture, concerns about the medical exposure of women to radiation exceeded 30%. Within the prefecture, the medical exposure of women, purchasing food products, and consumption of own-grown food were the main concerns. Within the prefecture, having children under the age of 18, the experience of measurement, and having experience of evacuation were significantly related to the intention to use an app. Conclusion: Regional and individual differences were evident. Since respondents differ, it is necessary to develop and promote app use in accordance with their needs and with phases of reconstruction. We expect that a suitable app will not only collect data but also connect local service providers and residents, while protecting personal information.

Using Roots and Patterns to Detect Arabic Verbs without Affixes Removal

  • Abdulmonem Ahmed;Aybaba Hancrliogullari;Ali Riza Tosun
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.1-6
    • /
    • 2023
  • Morphological analysis is a branch of natural language processing, is now a rapidly growing field. The fundamental tenet of morphological analysis is that it can establish the roots or stems of words and enable comparison to the original term. Arabic is a highly inflected and derivational language and it has a strong structure. Each root or stem can have a large number of affixes attached to it due to the non-concatenative nature of Arabic morphology, increasing the number of possible inflected words that can be created. Accurate verb recognition and extraction are necessary nearly all issues in well-known study topics include Web Search, Information Retrieval, Machine Translation, Question Answering and so forth. in this work we have designed and implemented an algorithm to detect and recognize Arbic Verbs from Arabic text.The suggested technique was created with "Python" and the "pyqt5" visual package, allowing for quick modification and easy addition of new patterns. We employed 17 alternative patterns to represent all verbs in terms of singular, plural, masculine, and feminine pronouns as well as past, present, and imperative verb tenses. All of the verbs that matched these patterns were used when a verb has a root, and the outcomes were reliable. The approach is able to recognize all verbs with the same structure without requiring any alterations to the code or design. The verbs that are not recognized by our method have no antecedents in the Arabic roots. According to our work, the strategy can rapidly and precisely identify verbs with roots, but it cannot be used to identify verbs that are not in the Arabic language. We advise employing a hybrid approach that combines many principles as a result.

Impact of dental imaging on pregnant women and recommendations for fetal radiation safety: A systematic review

  • Thiago Oliveira Gamba;Fernanda Visioli;Deise Renata Bringmann;Pantelis Varvaki Rados;Heraldo Luis Dias da Silveira;Isadora Luana Flores
    • Imaging Science in Dentistry
    • /
    • 제54권1호
    • /
    • pp.1-11
    • /
    • 2024
  • Purpose: This study was conducted to investigate the safety of dental imaging in pregnant women with respect to fetal health. Materials and Methods: Searches were conducted of the PubMed, Scopus, and Web of Science databases in May 2023. The inclusion criteria encompassed cross-sectional and longitudinal studies that focused on the analysis of diagnostic dental imaging in pregnant women, as well as studies utilizing phantoms to simulate imaging examinations. The exclusion criteria consisted of reviews, letters to the editor, book chapters, and abstracts from scientific conferences and seminars. Results: A total of 3,913 articles were identified. Based on a review of the titles and abstracts, 3,892 articles were excluded, leaving 21 articles remaining for full-text review. Of these, 18 were excluded, and 4 additional articles were included as cross-references. Ultimately, 7 articles underwent quantitative-qualitative analysis. Three retrospective studies were focused on pregnant women who underwent dental imaging procedures. The remaining 4 studies utilized female phantoms to simulate imaging examinations and represent the radiation doses absorbed by the uterus or thyroid. Conclusion: Few dental radiology studies have been conducted to determine the safe radiation threshold for pregnant women. Additionally, the reviewed articles did not provide numbers of dental examinations, by type, corresponding to this dose. Dental imaging examinations of pregnant women should not be restricted if clinically indicated. Ultimately, practitioners must be able to justify the examination and should adhere to the "as low as diagnostically acceptable, being indication-oriented and patient-specific" (ALADAIP) principle of radioprotection.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

포스트모더니즘의 관점에서 본 과학 관련 사회적 쟁점에 대한 온라인 토론의 과학교육적 함의: 광우병 사례를 중심으로 (Educational Implications about Online Debates on a Socio-Scientific Issue from a Postmodernist Perspective: Focus on the Mad Cow Disease)

  • 조헌국;송진웅
    • 한국과학교육학회지
    • /
    • 제30권8호
    • /
    • pp.933-952
    • /
    • 2010
  • 이 연구는 과학 관련 사회적 쟁점의 온라인 토론의 특징을 드러내고 이를 포스트모더니즘의 관점에서 해석하여 그 시사점을 제공하고자 한다. 연구 내용은 광우병과 관련된 과학적 주장 및 사회, 경제, 정치적 쟁점 간의 연결 관계를 보여주며 텍스트의 독창성, 저자와 독자의 관계, 발화 목적에 따른 특징을 드러내는 것이다. 이에 따라 본 연구는 온라인을 통한 사회적 논쟁의 대표적 사례인, 2008년 수입 쇠고기 논쟁을 중심으로 포털 사이트의 토론 게시판 66개의 글을 분석하였다. 연구 결과, 텍스트는 광우병과 관련된 5가지 과학적 논쟁 - 광우병의 발병원인, 변형 프리온의 검출 위치, 변형 프리온 섭취량과 인간 광우병의 발병 관계, 광우병에 대한 한국인의 유전적 취약 여부, 치매환자 증가와 광우병 사이의 상관관계 - 을 담고 있었다. 각 주장은 국내 소고기 시장의 파급 효과, 수입소 위생 및 사육환경, 무역 보복 가능성 등 다양한 사회적, 경제적, 정치적 문제가 얽혀 있었다. 독창성의 관점에서 텍스트는 짜깁기와 '펌', 독자에 의한 간섭을 통해 저자의 권한이 약화되고 집단적 특징의 글쓰기를 보여주었다. 나아가 저자와 독자 간의 거리를 좁히기 위해 저자의 정체성이나 개인적인 이야기들이 텍스트 속에 소개되었다. 발화 목적의 관점에서는 체계적인 논리와 정보의 전달보다는 감정 표현이나 행동의 변화가 중심이 되는 경향이 나타났다.

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

구글어스 기반의 지리교육 사이트 설계 및 구현 (Design and Implementation of Geographic Education Website Based on the Google Earth)

  • 이선주;강영옥
    • Spatial Information Research
    • /
    • 제18권2호
    • /
    • pp.13-24
    • /
    • 2010
  • 본 연구의 목적은 온라인과 오프라인 공간에 다양하게 존재하는 지리 관련 학습 자료를 지도를 기반으로 매쉬업한 지리교육사이트를 구현해 봄으로써 지도를 기반으로 한 지리교육의 가능성을 탐색해보고자 하였다. 최근 지오웹환경의 급격한 변화는 지리교육에 있어서도 지도에 기반한 다양한 변화가능성을 제안하고 있지만, 지리교육분야에서 그와 관련된 연구는 매우 제한적이었다. 그러나 본 연구에서는 첫째, 교과서 분석을 통하여 콘텐츠를 설계하고, 그 개념을 설명하기 위한 사진, 영상, 개념도 등 다양한 관련자료를 수집하였으며, 둘째, 수집된 자료를 구글의 오픈 API를 활용하여 지도기반으로 매쉬업하였으며, 셋째, 교과서 분석에 따른 내용분류와 수집된 자료를 바탕으로 지리교육사이트를 구축하였다. 본 연구는 공간을 다루는 지리교육에서 텍스트위주가 아닌 지도기반으로 교육을 할 수 있는 가능성을 탐색하고, 지오웹환경에서 교과서의 다양한 개념을 가장 잘 표현할 수 있는 방안을 모색하였다는데 의의가 있다.

Readability Comparison of Pro- and Anti-Cancer Screening Online Messages in Japan

  • Okuhara, Tsuyoshi;Ishikawa, Hirono;Okada, Masahumi;Kato, Mio;Kiuchi, Takahiro
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권12호
    • /
    • pp.5237-5242
    • /
    • 2016
  • Background: Cancer screening rates are lower in Japan than those in western countries. Health professionals publish procancer screening messages on the internet to encourage audiences to undergo cancer screening. However, the information provided is often difficult to read for lay persons. Further, anti-cancer screening activists warn against cancer screening with messages on the Internet. We aimed to assess and compare the readability of pro- and anti-cancer screening online messages in Japan using a measure of readability. Methods: We conducted web searches at the beginning of September 2016 using two major Japanese search engines (Google.jp and Yahoo!.jp). The included websites were classified as "anti", "pro", or "neutral" depending on the claims, and "health professional" or "non-health professional" depending on the writers. Readability was determined using a validated measure of Japanese readability. Statistical analysis was conducted using two-way ANOVA. Results: In the total 159 websites analyzed, anti-cancer screening online messages were generally easier to read than pro-cancer screening online messages, Messages written by health professionals were more difficult to read than those written by non-health professionals. Claim ${\times}$ writer interaction was not significant. Conclusion: When health professionals prepare pro-cancer screening materials for publication online, we recommend they check for readability using readability assessment tools and improve text for easy comprehension when necessary.

Word2Vec과 앙상블 합성곱 신경망을 활용한 영화추천 시스템의 정확도 개선에 관한 연구 (A Study on the Accuracy Improvement of Movie Recommender System Using Word2Vec and Ensemble Convolutional Neural Networks)

  • 강부식
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.123-130
    • /
    • 2019
  • 웹 추천기법에서 가장 많이 사용하는 방식 중의 하나는 협업필터링 기법이다. 협업필터링 관련 많은 연구에서 정확도를 개선하기 위한 방안이 제시되어 왔다. 본 연구는 Word2Vec과 앙상블 합성곱 신경망을 활용한 영화추천 방안에 대해 제안한다. 먼저 사용자, 영화, 평점 정보에서 사용자 문장과 영화 문장을 구성한다. 사용자 문장과 영화 문장을 Word2Vec에 입력으로 넣어 사용자 벡터와 영화 벡터를 구한다. 사용자 벡터는 사용자 합성곱 모델에 입력하고, 영화 벡터는 영화 합성곱 모델에 입력한다. 사용자 합성곱 모델과 영화 합성곱 모델은 완전연결 신경망 모델로 연결된다. 최종적으로 완전연결 신경망의 출력 계층은 사용자 영화 평점의 예측값을 출력한다. 실험결과 전통적인 협업필터링 기법과 유사 연구에서 제안한 Word2Vec과 심층 신경망을 사용한 기법에 비해 본 연구의 제안기법이 정확도를 개선함을 알 수 있었다.