• Title/Summary/Keyword: 문자전(文字塼)

Search Result 169, Processing Time 0.033 seconds

KcBERT: Korean comments BERT (KcBERT: 한국어 댓글로 학습한 BERT)

  • Lee, Junbum
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.437-440
    • /
    • 2020
  • 최근 자연어 처리에서는 사전 학습과 전이 학습을 통하여 다양한 과제에 높은 성능 향상을 성취하고 있다. 사전 학습의 대표적 모델로 구글의 BERT가 있으며, 구글에서 제공한 다국어 모델을 포함해 한국의 여러 연구기관과 기업에서 한국어 데이터셋으로 학습한 BERT 모델을 제공하고 있다. 하지만 이런 BERT 모델들은 사전 학습에 사용한 말뭉치의 특성에 따라 이후 전이 학습에서의 성능 차이가 발생한다. 본 연구에서는 소셜미디어에서 나타나는 구어체와 신조어, 특수문자, 이모지 등 일반 사용자들의 문장에 보다 유연하게 대응할 수 있는 한국어 뉴스 댓글 데이터를 통해 학습한 KcBERT를 소개한다. 본 모델은 최소한의 데이터 정제 이후 BERT WordPiece 토크나이저를 학습하고, BERT Base 모델과 BERT Large 모델을 모두 학습하였다. 또한, 학습된 모델을 HuggingFace Model Hub에 공개하였다. KcBERT를 기반으로 전이 학습을 통해 한국어 데이터셋에 적용한 성능을 비교한 결과, 한국어 영화 리뷰 코퍼스(NSMC)에서 최고 성능의 스코어를 얻을 수 있었으며, 여타 데이터셋에서는 기존 한국어 BERT 모델과 비슷한 수준의 성능을 보였다.

  • PDF

21세기 초일류기업의 정보기술에 대한 전략적 접근-인터넷 전략 및 가치측정을 중 심으로-

  • 신호균
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 1997.10a
    • /
    • pp.267-281
    • /
    • 1997
  • 인류는 정보전달매체의 변화를 통하여 오늘날 정보기술의 새로운 패러다임으로 변 화하게 되었다. 이러한 변화는 언어에 의한 문자혁명을 시작으로 종이에 의한 인쇄혁명, 통 신매체에 의한 통신혁명 나아가 정보기술의 발달로 인한 정보혁명의 시대로 발전하게 되었 다. 정보기술의 발달은 네트워크 및 통신기술의 진전으로 기업의 업무프로세스를 변혁하게 되었으며 기업은 인터넷을 전략적인 경쟁무기로 활용하게 되었다. 글로벌기업은 글로벌시장 에서 글로벌 네트워크를 통하여 21세기 초일류기업으로 살아 남기 위하여 인터넷의 전략적 활용을 더욱 강조하게 되었다. 이에 본 연구는 최근에 급속하게 확산되고 있는 인터넷의 전 략적 모형 및 비용편익분석을 중심으로 고찰하였다.

  • PDF

이달의통계 / 11월 입시정보사이트 트래픽 대폭 상승

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.1 s.116
    • /
    • pp.20-21
    • /
    • 2003
  • 지난해 11월 대입수학능력시험이 치러지고 대입전형이 시작되면서 다양한 입시 관련 정보를 제공하는 사이트들의 트래픽이 대폭 상승했다. 전에 비해 신입생 전형제도가 복잡해지면서 다양한 입시 관련 사이트들이 자세한 입시정보 서비스와 채점 서비스, 지원대학 정보등의 각종 부가 서비스를 제공 하고 있어 수험생과 학부모의 큰 인기를 끌었던것으로 분석된다. 디지털대성학원은 순방문자수가 10월 36만명에서 11월 90만명으로 2배이상 증가했으며, 전체 순위도 10월 823위에서 11월 425위로 400위 이상 큰 폭으로 상승했다. 이밖에도 씨스쿨, 에듀피아가 각각 전월대비 46만명, 36만명이 증가한 99만명, 105만명을 기록했다.

  • PDF

트랜드리포트 / 주거 개념의 변화 홈네트워킹이 제2의 디지털 혁명을 주도한다.

  • Jeong, Jin-Yeong
    • Digital Contents
    • /
    • no.1 s.92
    • /
    • pp.34-40
    • /
    • 2001
  • 인터넷 기반의 산업들이 발전하고, 이를 사용하는 사용자들이 점점늘어나고, 네트워크상에서 전송되는 정보가 일반문자 데이터에서 영상이나 음성과 같은 멀티미디어 데이터까지 확장되면서 점점 더 많은 정보를 요구하게 되고, 네트워크의 대역폭에 대한 부족함을 느끼게 되었다. 따라서, 점점 더 많은 대역폭을, 여러 사람들이 공유하면서 사용할 수 있는 환경에 대한 요구가 증대되었으며, 그 결과의 하나로 국내에서는 전 국가적인 사업으로 초고속 정보 통신망을 구축하기에 이르렀다. 전문가들은 네트워크와는 별도로 정보통신 및 정보 가전기기 분야에서, 기술의 급속한 발전으로, 상호호환성을 가지면서, 쉽게 다양한 서비스를 제공할 수 있는 집안에서의 네크워크, 소위 홈 네트워킹에 관심을 가지게 되었고, 가까운 시일내에 가정내의 모든 기기 들과, 집 외부의 네트워크간에 연결이 가능해질 것으로 보인다.

  • PDF

대기 중 노블가스 분석

  • Lee, Wan-Ro;Lee, Seung-Il;Choe, Sang-Do;Jo, Yeong-Hyeon;Jeong, Geun-Ho;Kim, Hui-Ryeong;Lee, Chang-U;Choe, Geun-Sik;Gang, Mun-Ja;Jeon, In;Geum, Dong-Gwon
    • 대한방사선방어학회:학술대회논문집
    • /
    • 2010.04a
    • /
    • pp.168-169
    • /
    • 2010
  • PDF

Development of An Imternet Solution for Blinds (시각장애인을 위한 인터넷 솔루션의 구현)

  • 이승수;민경석;주용덕;강성찬;김석일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.405-407
    • /
    • 2000
  • 컴퓨터의 전 분야가 그래픽 사용자 인터페이스로 변모함에 따라 문자를 중심으로 정보를 습득하던 시각장애인의 경우, 더욱 더 정보단절의 위기에 처하게 되었으며, 정보의 바다라 일컫는 인터넷에서도 마찬가지이다. 외국의 경우 화면읽기 프로그램을 이용하여 텔넷, 전자메일, FTP를 불편없이 사용할 수 있으며, 전용 웹 브라우져의 개발로 WWW까지도 이용할 수 있다. 우리 나라의 경우에는 시각장애인이 인터넷에 접근할 수 있는 환경이 구축되어 있지 않다. 따라서 본 논문에서는 시각장애인을 위한 사용자 인터페이스를 설계하고 그를 통해 윈도우용 웹 브라우져, 텔넷, FTP, 전자메일, 문서작성기 등의 인터넷 솔루션을 개발하였다.

  • PDF

Fast and simple algorithm for sorting by reversals and transpositions (전도와 전치 연산을 사용하여 정렬하는 빠르고 간단한 알고리즘)

  • 한보형;박근수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.674-676
    • /
    • 2000
  • 최근 들어 계산분자생물학 분야에서 문자열 알고리즘과 관련된 유전자 재배열 문제가 많은 관심을 끌고 있다. 특히 이러한 문제에는 전도(reversal)나 전치(transpositon)와 같은 재배열 연산들이 사용되고 있다. 전도와 전치 두 가지 연산을 모두 사용하는 정렬은 필요한 최소 연산 회수의 3배 이내의 연산 수행만으로 가능하다고 알려져 있다. 이 논문에서는 기존의 알고리즘을 분석하고 휴리스틱을 사용함으로써 실제 연산 수행 회수를 대폭 줄일수 있음을 보였다. 또한, 기존의 알고리즘보다 간단한 새로운 알고리즘을 제시하고, 이 알고리즘과 휴리스틱을 같이 사용하는 경우 수행 시간과 근사비(approximation ratio)에 있어서 매우 효과적임을 보였다.

  • PDF

A Trend of Smartphone Forensic Technology (스마트폰 포렌식 기술 동향)

  • Choi, W.Y.;Un, S.K.
    • Electronics and Telecommunications Trends
    • /
    • v.28 no.3
    • /
    • pp.1-8
    • /
    • 2013
  • 최근 들어 스마트폰의 사용이 급격하게 증가하고 있으며, 또한 스마트폰에는 통화기록과 문자 메시지뿐만 아니라 이메일, 아이디, 패스워드, GPS(Global Positioning System) 데이터, 신용카드 등 수많은 개인정보가 저장된다. 이에 따라 디지털 포렌식 수사에서도 스마트폰 포렌식의 비중이 크게 증가하고 있다. 현재 전 세계적으로 많은 종류의 스마트폰 운영체제가 상용화되고 있으나 안드로이드 OS와 iOS가 86%를 차지하고 있으며, 국내에서는 99% 이상을 차지하고 있다. 본고에서는 스마트폰 포렌식의 절차를 비롯해서 안드로이드 OS 및 iOS 디바이스로부터 데이터를 수집 및 분석하는 방법에 대해서 살펴본다.

  • PDF

Information types and characteristics within the Wireless Emergency Alert in COVID-19: Focusing on Wireless Emergency Alerts in Seoul (코로나 19 하에서 재난문자 내의 정보유형 및 특성: 서울특별시 재난문자를 중심으로)

  • Yoon, Sungwook;Nam, Kihwan
    • Journal of Intelligence and Information Systems
    • /
    • v.28 no.1
    • /
    • pp.45-68
    • /
    • 2022
  • The central and local governments of the Republic of Korea provided information necessary for disaster response through wireless emergency alerts (WEAs) in order to overcome the pandemic situation in which COVID-19 rapidly spreads. Among all channels for delivering disaster information, wireless emergency alert is the most efficient, and since it adopts the CBS(Cell Broadcast Service) method that broadcasts directly to the mobile phone, it has the advantage of being able to easily access disaster information through the mobile phone without the effort of searching. In this study, the characteristics of wireless emergency alerts sent to Seoul during the past year and one month (January 2020 to January 2021) were derived through various text mining methodologies, and various types of information contained in wireless emergency alerts were analyzed. In addition, it was confirmed through the population mobility by age in the districts of Seoul that what kind of influence it had on the movement behavior of people. After going through the process of classifying key words and information included in each character, text analysis was performed so that individual sent characters can be used as an analysis unit by applying a document cluster analysis technique based on the included words. The number of WEAs sent to the Seoul has grown dramatically since the spread of Covid-19. In January 2020, only 10 WEAs were sent to the Seoul, but the number of the WEAs increased 5 times in March, and 7.7 times over the previous months. Since the basic, regional local government were authorized to send wireless emergency alerts independently, the sending behavior of related to wireless emergency alerts are different for each local government. Although most of the basic local governments increased the transmission of WEAs as the number of confirmed cases of Covid-19 increases, the trend of the increase in WEAs according to the increase in the number of confirmed cases of Covid-19 was different by region. By using structured econometric model, the effect of disaster information included in wireless emergency alerts on population mobility was measured by dividing it into baseline effect and accumulating effect. Six types of disaster information, including date, order, online URL, symptom, location, normative guidance, were identified in WEAs and analyzed through econometric modelling. It was confirmed that the types of information that significantly change population mobility by age are different. Population mobility of people in their 60s and 70s decreased when wireless emergency alerts included information related to date and order. As date and order information is appeared in WEAs when they intend to give information about Covid-19 confirmed cases, these results show that the population mobility of higher ages decreased as they reacted to the messages reporting of confirmed cases of Covid-19. Online information (URL) decreased the population mobility of in their 20s, and information related to symptoms reduced the population mobility of people in their 30s. On the other hand, it was confirmed that normative words that including the meaning of encouraging compliance with quarantine policies did not cause significant changes in the population mobility of all ages. This means that only meaningful information which is useful for disaster response should be included in the wireless emergency alerts. Repeated sending of wireless emergency alerts reduces the magnitude of the impact of disaster information on population mobility. It proves indirectly that under the prolonged pandemic, people started to feel tired of getting repetitive WEAs with similar content and started to react less. In order to effectively use WEAs for quarantine and overcoming disaster situations, it is necessary to reduce the fatigue of the people who receive WEA by sending them only in necessary situations, and to raise awareness of WEAs.