• 제목/요약/키워드: Text data

검색결과 2,957건 처리시간 0.034초

10학년 과학 교과서 지구 단원의 탐구 과제 분석 (Analysis of Inquiry Tasks in Earth Unit of the 10th Grade Science Textbooks)

  • 김정률;김명숙;박예리
    • 한국지구과학회지
    • /
    • 제26권6호
    • /
    • pp.501-510
    • /
    • 2005
  • 10학년 과학 교과서 지구 단원의 학습 내용에 포함되어 있는 탐구 과제가 제7차 교육 과정의 목표에 따라 제시되었는지를 판단하기 위해 11종 과학 교과서의 기본 과정에 제시되어 있는 탐구 과제의 유형과 기본 탐구 기능, 통합탐구 기능, 탐구 활동의 빈도를 조사하였고, 제시된 탐구 기능과 활동이 적절한지를 분석하였다. 분석한 결과 탐구 과제는 평균 24.0개가 제시되었으나 교과서마다 차이가 있었고 제시하는 유형이 달랐다. 탐구 활동의 빈도는 교과서마다 달랐고 제시된 것보다 더 많이 분석되었으며 통합적인 활동으로 제시되지 않고 하나의 탐구 기능처럼 제시되어 있었다. 또한 교과서에 제시된 통합 탐구 기능은 $77.2\%$로 기본 탐구 기능 $22.8\%$보다 많은 것으로 보였지만, 실제로 기본 탐구기능과 통합 탐구 기능의 분포 비율은 각각 $45.6\%$$56.4\%$로 조사되었다. 각 탐구 기능 중에서는 추리$(49.5\%)$와 자료해석$(68.7\%)$이 가장 많이 있었고, 문제 인식, 가설 설정, 일반화 등의 탐구 요소는 제시되고 있지 않았다. 또한 제7차 교육 과정에서 탐구 기능, 탐구 활동에 대한 의미를 제시하고 있지 않기 때문에 교과서마다 본질적 의미와 일치하지 않거나 협소한 의미로 사용되고 있었다. 이는 교육 과정이 탐구, 탐구 기능, 탐구 활동에 대한 의미를 조작적 수준으로 제시하고, 탐구 활동을 구성하기 위한 기준을 마련한 필요가 있음을 시사한다.

국내 핀테크 동향 및 모바일 결제 서비스 분석: 텍스트 마이닝 기법 활용 (Fintech Trends and Mobile Payment Service Anlaysis in Korea: Application of Text Mining Techniques)

  • 안정국;이소현;안은희;김희웅
    • 정보화정책
    • /
    • 제23권3호
    • /
    • pp.26-42
    • /
    • 2016
  • 최근 O2O 시장의 급성장과 더불어 금융과 ICT 기술이 융합된 핀테크가 "금융의 O2O"화를 이끌 혁신으로 주목 받고 있으며, 핀테크 기반의 결제, 인증, 보안 기술 및 관련 서비스가 주목 받고 있다. 핀테크와 같은 신기술 산업에는 기술적인 원천과 더불어 관련 제도 및 규제가 중요한데, 아직은 국내 핀테크 산업의 제도와 기술동향에 관한 심층적인 연구가 부족한 실정이다. 따라서 본 연구에서는 국내 핀테크 동향을 분석하고, 더 나아가 국내 대표적 모바일 결제서비스인 카카오페이와 삼성페이를 비교하여, 향후 국내 핀테크 산업의 기술과 제도의 방향성에 대한 시사점을 찾고자 한다. 본 연구는 핀테크가 언급된 트윗들을 2014년 8월부터 2016년 6월까지 전수 조사하여, 토픽 추출, 감성 분석, 키워드 네트워크 분석들을 시각화 하였다. 분석한 결과, 2014년에서 2016년 사이에 기술과 제도에서 다양한 주제들이 생성되어 왔음을 확인할 수 있었으며, 카카오톡과 같은 "서비스" 기반의 카카오페이와 갤럭시와 같은 "기기" 기반의 삼성페이의 토픽들 간에도 서로 다른 키워드들과 반응들이 추출되었다. 본 연구는 소셜미디어 마이닝을 이용하여 소셜미디어의 비정형 데이터를 기간 별로 분석하고, 감성분석을 통해 서비스에 대한 소비자들의 기대와 반응을 정량화한 것에 의의가 있다. 이를 통하여 핀테크 관련 실무자들에게 전략적 방향을 제시함으로써 핀테크 산업발전의 기반이 될 수 있을 것으로 기대한다.

안전신문고를 이용한 재난 예측 방법론 제안 (Research Suggestion for Disaster Prediction using Safety Report of Korea Government)

  • 이준;신진동;조상명;이상화
    • 한국방재안전학회논문집
    • /
    • 제12권4호
    • /
    • pp.15-26
    • /
    • 2019
  • 안전신문고는 2014년부터 운영되고 있으며, 2019년 7월까지 약 1백만 건의 누적신고건수가 존재한다. 본 연구에서는 정보화시대가 되고 있는 현 시점에서 약 116만 건이 넘은 안전신문고의 신고내용을 분석하여 국민의 소리와 관심이 과연 얼마나 힘이 있고 의미가 있는지 확인하고자 한다. 특히, 예측능력에 관심을 두고 있는데, 과연 안전신문고의 신고내용이 향후 일어날 수 있는 재난과 연관성이 있는지 확인하고자 하였다. 이를 위해 연구진은 안전신문고에 신고된 자료를 텍스트로 받아 자연어 분석 방법(Natural Language Processing)론에 의해 분석하였다. 이를 토대로 안전신문고 분석 기간 동안의 신문기사를 분석하여 안전신문고와 신문 기사 내용 간의 상관관계를 분석하였다. 그 결과 응답 및 확인 관련 보고서의 수가 증가함에 따라 몇 달 내 사고가 발생하였으며, 사회의 불안에 대해 사전에 보고된 안전문고의 내용을 분석하면 미래 재난 예측에 활용될 수 있을 것이라 판단된다.

영어 작문 자동채점에서 ConceptNet과 작문 프롬프트를 이용한 주제-이탈 문서의 자동 검출 (Automatic Detection of Off-topic Documents using ConceptNet and Essay Prompt in Automated English Essay Scoring)

  • 이공주;이경호
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1522-1534
    • /
    • 2015
  • 본 연구에서는 미리 구축해 놓은 학습데이터 없이도 입력된 작문이 주어진 작문 주제에 적합한 내용인지 아닌지를 자동으로 판단할 수 있는 방법을 제안한다. ConceptNet은 다양한 종류의 문서에서 추출한 자연언어 문장들로부터 구축된 그래프 형태의 지식베이스이다. 본 연구에서는 작문 주제에 해당하는 작문 프롬프트(essay prompt)와 ConceptNet만을 이용하여 문서의 주제-이탈 여부를 판별하는 방법을 제안한다. ConceptNet에서 두 개념간의 최단 경로를 찾고 이에 대한 의미 유사도를 계산하는 방법을 제안한다. 이를 이용하여 작문 프롬프트와 수험생 작문 내용을 ConceptNet의 개념들로 매핑하고 이 개념들 사이의 의미 유사도를 계산하여 작문 프롬프트와 수험생 작문 사이의 주제 부합 여부를 판단한다. 8개의 작문 시험을 수행하여 얻은 수험생 작문 데이터에 대하여 평가를 수행한 결과 기존의 연구에 비해 좋은 성능을 얻을 수 있었다. ConceptNet을 활용하면 유의미한 단순 추론이 가능하기 때문에 본 연구에서 제안한 방법은 추론을 요하는 작문 문제에도 적용 가능함을 보였다.

팬데믹 시대, 텍스트 마이닝을 통한 의학드라마의 시청자 반응 연구-<슬기로운 의사생활>을 중심으로- (Pandemics Era, A Study one the Viewers' Responses of Medical Drama through Text Mining. -Focused on -)

  • 안성훈;오세종;정달영
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.385-389
    • /
    • 2020
  • 의학드라마 <슬기로운 의사생활>은 '사람' 중심의 스토리로 전개되어 시청자의 공감대를 높였다. 드라마의 스토리는 의사, 환자, 가족들의 진정한 삶의 이야기이다. 또한 '평범한 우리들의 조금 특별한 매일'을 떠오르게 하는 이야기이다. 그리고 드라마 5명 캐릭터가 직접 연주하고 불렀던 노래는 향수를 자극하고, 몰입을 높이는 요소가 되었다. 최고시청률 14.1%를 달성했으며, 블로그만 51,584건이 등록되었다. 빅데이터 분석에 따르면, 연관어는 '슬기로운 OST', '앨범명', '아티스트명', '2시간 연속재생', '음원', '리메이크', 'OST 공개', '슬기의사생활 전곡방송본', '광고수익', '신청곡', '플레이리스트', '아로하', '조정석'이 추출되었다. 의학드라마의 상품화는 '드라마 OST 앨범 판매', '온라인 라이브 콘서트 주최(광고 PPL)', '피아노 악보 출간', '사람 중심의 사진전', '드라마 하이라이트를 편집한 뮤직 비디오 제작', '유튜브 업로드 수익', '마스크', '소독제'가 있다. <슬기로운 의사생활2>에서는 코로나19에 발생한 감동적인 사연과 매력적인 인간미가 있는 이야기가 펼쳐질 것으로 예측한다. 연구의 한계점은 장르별 다양한 작품의 분석과 업종에 따른 소비자 가치 분석 시도가 필요하겠다.

국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계 및 기계학습 기반 자동 인덱싱 방법 연구 (Metadata Design and Machine Learning-Based Automatic Indexing for Efficient Data Management of Image Archives of Local Governments in South Korea)

  • 김인아;강영선;이규철
    • 한국기록관리학회지
    • /
    • 제20권2호
    • /
    • pp.67-83
    • /
    • 2020
  • 국내의 많은 지방자치단체에서는 지역에서 발생하는 사건들에 대한 시청각 기록물을 사람들이 쉽게 열람할 수 있도록 온라인 서비스를 제공하고 있다. 그러나 지자체들의 현재 사진 기록물 관리 방식은 표준적인 메타데이터가 부재하고 사진의 정보를 활용하지 않기 때문에 지자체 간 호환성과 검색 편의성이 낮은 문제점을 가진다. 이와 같은 문제점을 개선하기 위해, 본 논문에서는 국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계와 기계학습 기반 자동 인덱싱 기술을 제안한다. 먼저, 본 논문에서는 국내 지자체 사진 기록물에 특화된 메타데이터를 설계하여 지자체 간 사진 기록물의 호환성을 높이고, 사진의 기본 정보와 특성을 나타낼 수 있는 요소들을 메타데이터 항목에 포함함으로써 사진 기록물의 효율적인 관리를 가능하게 한다. 또한, 기계학습 기술을 기반으로 사진의 사건과 카테고리를 반영하는 정보인 사진 속 텍스트와 객체를 자동 인덱싱하여, 사진 기록물 검색 시 사용자 검색의 편의성을 높인다. 마지막으로, 본 논문에서는 제안한 방법을 사용하여 국내 지자체 사진 기록물에서 텍스트와 객체를 자동으로 추출하고, 추출한 내용과 기본 정보를 본 논문에서 설계한 사진 기록물 메타데이터 항목에 저장하는 프로그램을 개발하였다.

TF-IDF와 소설 텍스트의 구조를 이용한 주제어 추출 연구 (Study on Extraction of Keywords Using TF-IDF and Text Structure of Novels)

  • 유은순;최건희;김승훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.121-129
    • /
    • 2015
  • 도서 상품에 대한 정보량이 폭증하면서 고객이 도서 선택에 어려움을 겪는 상황이 발생하고 있다. 이에 따라 고객에게 적합한 도서 정보를 제공하여 구매를 유도하는 도서 추천시스템의 중요성이 커지고 있다. 하지만 도서의 서지정보나 사용자 정보 등을 이용한 기존의 추천시스템은 추천 결과의 신뢰도에 문제를 드러내고 있기 때문에 도서 본문 텍스트의 의미적 정보를 추천시스템에 반영하는 것이 필요하다. 따라서 본 논문은 이에 대한 선행연구로 TF-IDF기법과 소설의 외형적 구조를 이용한 소설 텍스트의 주제어 추출 방법을 제안하였다. 이를 위해 100권의 소설텍스트를 수집하고 각각의 소설을 머리말, 대화문, 비대화문, 맺음말의 4개의 구조로 분리한 후 TF-IDF 가중치를 계산하였다. 실험결과 본문 텍스트만을 이용했을 때 보다 머리말과 맺음말을 포함하고 대화문에 가중치를 높게 부여하였을 때 주제어의 추출 정확도가 42.1%의 성능 향상을 보였다.

무선 인터넷 서비스를 위한 HTTP 기반의 응용 계층 보안 프로토콜 ((An HTTP-Based Application Layer Security Protocol for Wireless Internet Services))

  • 이동근;김기조;임경식
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권3호
    • /
    • pp.377-386
    • /
    • 2003
  • 현재 무선 인터넷에서 안전한 서비스를 제공하기 위하여 Secure HyperText Transfer Protocol(S-HTTP), Secure/Multipurpose Internet Mail Extensions(S/MIME), Secure Sockets Layer(SSL)/Transport Layer Security(TLS)와 Wireless TLS(WTLS) 등의 여러 가지 보안 프로토콜이 사용되고 있다. 그러나 S-HTTP와 S/MIME은 특정 응용에 한정적으로 사용 가능하며 SSL/TLS와 WTLS는 채널 보안으로 인하여 자원 낭비가 심할 뿐만 아니라 전자 서명 기능 또한 제공하지 못한다. 본 논문에서는 S-HTTP와 SSL/TLS의 장점을 수용하고 HTTP 기반에서 TLS 보안 메커니즘을 이용한 새로운 형태의 응용 계층 보안 프로토콜인 Application Layer Security(ALS)를 제안한다. ALS는 HTTP 기반에서 동작하므로 다양한 하부 전송망에 독립적이고, 보안을 필요로 하는 응용에 대하여 보안 인터페이스를 제공하는 방법을 통하여 특정 응용에 종속적이지 않는 특성을 가진다. 또한, TLS의 검증된 보안 메커니즘을 적용하여 안전성을 확보하였고, 인증, 기밀성, 무결성, 전자 서명 서비스 및 부분 암호화를 지원함으로써 응용에서 요구하는 다양한 서비스를 제공할 수 있다. 마지막으로 본 논문에서는 ALS를 이용한 Wireless Application Protocol의 단대단 보안 구현 내용을 기술한다.

문맥종속 화자인식을 위한 준비반복 벡터 양자기 설계 알고리즘 (A Semi-Noniterative VQ Design Algorithm for Text Dependent Speaker Recognition)

  • 임동철;이행세
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.67-72
    • /
    • 2003
  • 이 논문은 문맥 종속 화자인식에 사용될 벡터 앙자기의 설계법 개선에 관한 연구이다. 구체적으로 벡터 양자기 코드북 생성 과정에서 기준 화자를 제외한 모든 비기준 화자에 대해 비반복적 학습 방법을 사용하여, 학습에 필요한 계산 복잡도를 획기적으로 줄이는 방법을 제안한다. 이 제안된 준비반복 벡터 양자기 설계법은, 종래의 설계법이 모든 화자의 코드북 생성에 반복적 학습 설계를 사용한다는 것과 대조를 이룬다. 준비반복 벡터 양자기 설계법의 특징은 다음과 같다. 첫째, 이 설계법은 단지 기준 화자에 대하여만 반복 학습을 수행하고 비기준 화자에 대하여는 반복 학습을 하지 않는다. 둘째, 설계된 비기준 화자의 양자 영역은 기준화자의 양자 영역을 원용하며, 양자점은 자신의 통계 분포에 대해 최적점으로 설정된다. 수치 실험은 화자 20명에 대하여 멜켑스트럼 12차 특징벡터를 사용하였고 코드북 크기를 2부터 32까지 변화시키면서 기존의 벡터 양자기 인식법과 비교하였다. 제안된 방법은 코드북 크기가 적절하고 학습 데이터 길이가 충분한 경우 인식률 100%로 기존의 방법과 같은 결과를 보였다. 따라서 제안된 준비반복 벡터 양자기 설계법은, 설계에 필요한 학습 횟수가 획기적으로 줄면서 인식률은 보존되어, 새로운 대안이 될 것으로 사료된다.

문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석 (Weighted Subject - Method Network Analysis of Library and Information Science Studies)

  • 이기헌;정효정;송민
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.457-488
    • /
    • 2015
  • 본 연구는 1990년부터 2014년까지 25년 간 국외 유수 문헌정보학 학술지들에 게재된 논문들을 대상으로 연구 주제와 연구 방법을 구분하여 현 선도 학술지의 연구 누적 현황을 분석하였다. 연구 주제와 연구 방법을 구분하고 그들 간의 관계를 살펴보기 위해 가중 주제-방법 네트워크를 개발하였다. 이는 주제와 방법으로 구성된 네트워크이며, 해당 토픽 소속 단어의 동시 출현 빈도를 기초로 주제와 방법에 가중치를 준다. 본 연구 결과에 따르면, 지난 25년간 경영정보시스템, 정보요구분석, 계량서지연구, 정보정책 등이 상위 연구 주제들이었다. 또한, 모델링, 개념/문헌연구, 연구협업분석, 웹데이터 분석 등이 상위 연구 방법들이었으며, 최근 텍스트 마이닝의 비상이 괄목할 만하다. 빈번히 짝을 이루는 연구 주제들과 연구 방법들의 지난 25년간의 군집들과 최근 5년간의 군집들을 살펴보면, 계량서지연구가 네트워크분석 방법들을 다수 적용하면서 그 저변을 넓히며 자리를 확고하게 하고 있으며, 텍스트 마이닝이 의료정보시스템, 이용자인터페이스에 특화되고 있음을 확인할 수 있다. 이러한 연구 결과는 문헌정보학의 선도 연구자들의 관심 연구 영역과 관점을 확인시켜주고, 향후 문헌정보학 발전을 위한 연구 설계의 기초자료로 활용될 수 있다.