• 제목/요약/키워드: social media and society

검색결과 1,788건 처리시간 0.031초

4차 산업혁명 시대의 사이버네틱스와 휴먼·포스트휴먼에 관한 인문학적 지평 연구 (An Interdisciplinary Approach to the Human/Posthuman Discourses Emerging From Cybernetics and Artificial Intelligence Technology)

  • 김동윤
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.836-848
    • /
    • 2019
  • 본 글은 오늘날 과학기술 분야에서 큰 영향을 미친 사이버네틱스와 이를 계승한 인지과학, 인공지능, 이로 인해 촉발된 포스트휴먼 담론으로 이어지는 맥락을 살펴보고자 한다. N. 위너에 의해 주창된 사이버네틱스는 현대정보과학과 뉴런망(網) 개념을 배태하는데 큰 역할을 하였으며 인간의 정신(mind)을 디지털 부호화하려는 현대 뇌신경과학에 많은 영향을 주었다고 말해진다. N. 위너는 인간은 커뮤니케이션의 동물이라고 전제하고 피드백에 입각한 정보이론을 정립하고자 하였다. 위너는 기존 인간의 부정적인 국면들(폭력성, 야만성 전쟁 등)과 전체주의적인 선동 선전에 의해 정보의 엔트로피가 증가했기 때문이라고 보았다. 이러한 부정적인 정보의 엔트로피를 제거하기 위해서 사이버네틱스, 즉 자동제어 장치를 통해 정보가 자유롭게 유통되는 시스템을 고안한 것이다. 이제 인간 사회는 피드백 효과에 바탕을 둔 정보이론과 그 시스템에서 서로 소통하게 되는 것이다. 그러나 위너는 인간이 기계가 되고 매체가 과잉 정보로 인해 정보가 전달하는 메시지가 단지 되풀이되는 것을 경계하였다. 그럼에도 불구하고 사이버네틱스는 닫혀진 시스템으로서 복합성에 의해 비판 받게 되었다. 그 이후 사이버네틱스 개념은 이를 계승한 인지과학의 영역에서 인지주의(Cognitivism)를 낳았고 이는 오늘날 인공지능 개발의 기반 인식을 형성하고 있다. 인지주의의 단적인 예는 인간 뇌를 뉴런 개념으로 파악하여 뉴런을 디지털 부호화 함으로써 '뉴런인간'(장 피에르 샹죄)을 탄생시키는 것이다. 뉴런 인간의 개념은 인간과 기계를 동일시하고 인간의 탈신체화, 인간 신체의 탈문질화 가능성을 열어 놓았다는 점에서 의미심장하다. 다른 한편 인간 뇌의 디지털 부호화와 신체의 탈물질화는 N. K. 헤일즈가 말하는 '포스트휴먼'의 이상에 가깝다. 도나 J 헤러웨이의 '사이보그 선언'도 포스트휴먼의 이상을 사이보그로 구현하려 한다. 디지털 혁명으로 촉발된 포스트휴먼 개념은 기존 인간에 대한 정의와 위상, 인간과 기계의 관계와 경계를 근본적이고 급진적인 방식으로 질문한다. 인간의 이상과 인류의 오랜 염원은 인간 존재를 불멸화하는 것이다. 18세기 계몽주의자 콩도르세가 말하는 완벽가능성의 이상은 완벽하게 만들어진 인간에 대한 환상과 신화이다. 귄터 안더스는 인간이 완벽하게 만들어지지 않고 불완전한 인간으로 태어난 것을 부끄럽게 여긴다고 말한다. 인간의 자가제조를 통한 완벽성의 꿈과 환상은 삶의 지평에서 - 불멸을 꿈꾸면서 - 죽음을 후퇴시키고 삶으로서의 세계(Lebenswelt)를 축출한다. 삶의 세계는 삶의 풍요로운 의미의 근원이자 실존적 지평이다. NBIC 기술, 사이버네틱스, 인공지능, 뇌신경과학의 다양한 형태의 결합은 '호모 아티피시알리스'(Homo Artificialis, 인공인간)를 창발함으로써 오랜 시간 속에서 숙성된 인문적 성찰과 지혜, 그것이 사유한 삶의 근원으로서의 실존적 지평을 근본적으로 뒤흔들고 있는 것이다. 이러한 급진적인 과학기술적 변화의 맥락에서 떠오른 '포스트휴먼' 개념은 - 역설적이게도 - 인간(휴먼)의 위상, 삶의 의미, 존재의 지평 등 가장 인간(학)적 형이상학적 실존적인 질문들을 재점화하고, 깊은 인문적 성찰을 요구하고 있다.

한국인(韓國人) 중고교생(中高校生)들의 흡연실태(吸煙實態)에 관(關)한 연구 (A Study on the Smoking Status of the Korean Middle and High School Students)

  • 박순영
    • 한국학교보건학회지
    • /
    • 제7권1호
    • /
    • pp.57-71
    • /
    • 1994
  • I investigated actual conditions of smoking of teenagers who were randomly chosen middle and high school students. 1. Juvenile smoking 1) Parents' opinions of juvenile smoking Most parents do not want their children to smoke after growth : 88.6% of fathers (middle school students: 88.9%, high school students: 88.4%) and 95.1% of mothers (middle school students: 93.4%, high school students :95.5%). 2) Teenagers' opinions of smoking after growth The rate of students who will smoke after growth is 10.8% (middle school students: 12.0%, high school students: 9.9%): students in agricultural areas show the higher rate than those in cities. 3) Parents' opinions of their children's smoking now 1.5% of fathers want their children to smoke now (middle school students: 1.3%, high school students: 1.6%) and 1.1% of mothers do (middle school students: 0.6%, high school students: 1.5%). This shows that most parents do not want their children to smoke now. 4) Students' opinions of their friends' smoking now Students who want their friends smoke now cover 7.8% (middle school students: 7.1%, high school students: 8.4%). This rates are higher than those of parents shown in (3). And more high school students and more girl students gave the positive reponse than middle school boy and girl students, respectively. 5) Students' views of smoking "Look like an adult" covers the rate of 4.0% (boy: 7.8%, girl:3.6%) 6.7% of middle school students have this view, while 3.7% of high school students have. 16.1% of students had an experience of smoking during the last one year (boy: 29.9%, girl: 8.6%): this shows that the rate of the boy students is more than 3 times greater than that of the girl students and high students who experienced smoking last year covers 20.2%, while middle school students shows 10.9%. 6) Actual conditions of students' smoking The present rate of students' smoking is 22.4% (boy:38.3%, girl:13.8%): the rate of boy students is greater than that of girl students. Students who smoke more than pack of cigarettes a day cover 8.2% (boy: 17.5%, girl: 3.2%): 5.2% of middle school students (boy:11.4%, girl: 2.1%) smoke more than one pack while 10.7% of high school students do (boy:21.5%, girl: 4.2%). This shows that the rate of boy students' smoking is greater than that of girl students' smoking. 7) The rate of smoking of students' parents 75.4% of fathers (city: 74.5%, agricultural area:75.9%) smoke: and more than a half (62.4%) smoke more than a pack cigarettes a day. On the other hand, the rate of smoking mothers is 5.2%(city: 4.3%, agricultural area: 7.3%): the rate is higher in agricultural areas. 8) Opinions of smoking population in the future 61.4% of students answered that smoking population will increase, while 27.0% have the opinion that smoking population will decrease. 2. Opinions of the effects of smoking on health 1) Have you heard that smokers are likely to suffer from tuberclosis? 78.3% of students said yes (boy: 80.8%, girl: 76.4%): it is shown that the rate of boys is greater than that of girls. 2) Have you heard that smokers are likely to get out of endurance? 76.6% of students (boy: 69.3%, girl: 49.7%) answered yes: it is shown that the rate of boys is greater than that of girls. 3) Have you heard that heart-beats get fast when one smokes? 32.5% of students (boy: 35.5%, girl: 30.9%) answered yes: 32.2% in cities(boy: 33.0%, girl: 31.8%) and 33.5% in agricultural areas(boy: 41.8%, girl: 28.8%): and 28.7% middle students and 35.5% of high school students answered yes. 4) Have you heard that smokers are likely to have heart-diseases? 35.1% of students (boy: 34.0%, girl: 34.1%) answered yes: 35.3% in cities (boy: 37.2%, girl: 34.2%) and 36.7% in agricultural areas (boy: 39.0%, girl: 33.9%): 34.8% of middle school students and 35.4% of high school students. 5) Have you heard that smokers are likely to have a lung cancer? 91.4% of students (boy: 93.2%, girl: 89.9%) answered yes: 90.35% in cities and 94.2% in agricultural areas. 6) Have you heard that the life of smokers gets shorter? 94.3% of students (boy:94.6%, girl: 92.2%) answered yes. 7) Have you heard that pregnant smokers will deliver a baby with low birth weight? 29.6% of students (boy: 29.8%, girl: 29.4%) answered yes: the rates of boys and girls almost the same. 8) Have you heard that one feels calm when one smokes? 80.1% of students (boy: 81.8%, girl: 79.2%) answered yes: boys and girls showed almost the same rate. 3. Preventive measures Smoking people continued to increase all over the world because smoking not only mitigated emotional uneasiness such as loneliness, nervousness and so on, but also could be very helpful from the social perspective. This was so because they did not consider harmful effects of smoking on health, and victims. However, because any -one can have physical disorders caused by smoking, people should always keep in mind the following preventive measures. 1) Doctors or teachers should set an example of giving up smoking. Informing patients or students of harmful effects of smoking to persuade their family and relatives not to smoke. 2) Through mass media like newspapers, periodicals or broadcasting, to make people know harmful effects of smoking and not smoke. 3) To prohibit selling teenagers cigarette by law. 4) To prohibit smoking in public places like work places, offices, lecture rooms, recreation rooms, buses, trains and so on. 5) To decrease the rate of life insurance for non-smokers as in foreign countries and to give a warming of the harmful effects on cigarette packets or ads.

  • PDF

호주 일 지역의 병원 자원봉사활동 실태와 만족도 (Study of the Actual Condition and Satisfaction of Volunteer Activity in Australian Hospital)

  • 박금자;최해영
    • Journal of Hospice and Palliative Care
    • /
    • 제9권1호
    • /
    • pp.17-29
    • /
    • 2006
  • 목적: 호주 일 지역의 종합병원을 중심으로 이루어지고 있는 호스피스 자원봉사자들의 특성을 파악하고 이들이 실제 환자들에게 시행하고 있는 활동내용과 그 만족도를 파악하기 위하여 시도하였다. 방법: 101명의 자가보고 질문지에 의해 자료수집되었으며, 자료의 분석은 SPSS/WIN 12.0 프로그램을 이용하여 다음과 같이 빈도와 백분율, 평균과 표준편차로 분석하였다. 결과: 1. 병원에서의 봉사활동경력은 $5{\sim}10$년이 32.7%, 10년 이상이 30.7%, $2{\sim}3$년이 11.9%, $3{\sim}5$년이 10.9%의 순이었다. 주요 봉사활동 형태는 신체적 간호가 32.7%, 신체 및 정서적 간호가 14.9%, 기타가 18.8%의 순이었다. 봉사업무할당 방법은 봉사활동 조정자에 의해서가 55.7%, 봉사자의 뜻에 따라서와 봉사자와 조정자의 합의에 의해서가 각각 20.5%의 순이었다. 봉사활동을 하는 주요 이유는 아픈 사람을 돕고 싶어서가 61.4%로 가장 많았으며, 다음은 여가시간을 선용하기 위해서가 22.8%였다. 봉사활동을 시작하게 된 경로는 자신의 조사에 의해서가 43.4%로 가장 많았으며, 다음은 다른 봉사자로부터 듣고서가 30.7%, 대중매체로부터가 13.1%의 순이었다. 봉사활동관련 교육을 받은 여부는 받았다가 80.2%였다. 봉사활동업무가 자신의 기술과 기능에 맞는 정도는 아주 잘 맞는다가 74.0%였고, 다음은 대체로 맞는다가 18.0%로 대체로 잘 맞는 것으로 나타났다. 봉사활동에 대해 받는 보상은 토큰이나 점심 혹은 집단 소풍이 31.7%로 가장 많았고, 다음은 토큰과 점심이나 집단 소풍이 각각 19.8%였다. 봉사활동에 대한 평가빈도는 이따금이 37.2%, 자주가 30.9%, 항상이 17.0%, 전혀 안 함이 14.9%의 순이었다. 봉사활동조정자와 관계는 매우 좋다가 85.0%로 대부분을 차지하였으며, 다른 봉사자와의 관계는 매우 좋다가 81.2%로 대부분을 차지하였고, 병원직원과의 관계는 매우 좋다가 69.7%였고, 다음은 대체로 좋다가 21.2%의 순이었다. 봉사활동에 대해 가족이나 친구의 지지는 어떠한가는 매우 좋다가 83.2%로 대부분을 차지하였다. 2. 대상자의 자원봉사활동 만족도는 평점 $3.09{\pm}0.49$(도구범위 $1{\sim}4$점)로 중간정도이었다. 영역별로 살펴보았을 때 만족도가 가장 높았던 영역은 사회적 접촉영역($3.48{\pm}0.61$)이었고, 다음은 성취영역($3.43{\pm}0.53$), 사회적 인정영역($3.35{\pm}0.70$)의 순이었다. 만족도가 가장 낮았던 영역은 사회적 교환영역($1.65{\pm}0.63$)이었다. 3. 대상자의 인구사회학적 특성에 따른 봉사활동 만족도를 분석한 결과 성별(t=2.038, P=0.044), 결혼상태(F=3.806, P=0.013)에 따라 유의한 차이를 보였다. 4. 대상자의 자원봉사활동 실태에 따른 봉사활동 만족도를 분석한 결과병원봉사활동기간(F=3.326, P=0.008), 봉사활동을 하는 주된 이유(F=2.707, P=0.035), 봉사활동을 위한 교육을 받은 여부(t=-1.982, P=0.050), 봉사활동의 평가 빈도(F=7.877, P=0.000), 봉사활동이 자신의 기술이나 능력에 적합도(F=2.712, P=0.049), 관리자와의 관계(t=-2.517, P=0.013), 다른 병원직원과의 관계(F=5.202, P=0.007), 자원봉사자로서의 활동에 대해 가족이나 친지로부터의 지지(t=-3.394, P=0.001)에 따라 봉사활동 만족도가 유의하게 차이가 있는 것으로 나타났다. 결론: 자원봉사활동 만족도는 중간정도이었고, 봉사활동 만족도는 대상자의 인구사회학적 특성에 따라서는 성별(t=2.038, P=0.044), 결혼상태(F=3.806, P=0.013)에 따라 유의한 차이를 보였고, 자원봉사활동 실태에 따라서는 병원봉사활동기간(F=3.326, P=0.008), 봉사활동을 하는 주된 이유(F=2.707, P=0.035), 봉사활동을 위한 교육을 받은 여부(t=-1.982, P=0.030), 봉사활동의 평가 빈도(F=7.877, P=0.000), 봉사활동이 자신의 기술이나 능력에 적합도(F=2.712, P=0.049), 관리자와의 관계(t=-2.517, P=0.013), 다른 병원직원과의 관계(F=5.202, P=0.007), 자원봉사자로서의 활동에 대해 가족이나 친지로부터의 지지(t=-3.394, P=0.001)에 따라 유의한 차이가 있는 것으로 나타났다. 따라서 자원봉사자를 관리할 때에 위의 요인들을 고려할 것이 요구된다고 볼 수 있다.

  • PDF

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.