• 제목/요약/키워드: Language as a system

검색결과 2,396건 처리시간 0.039초

앙상블 머신러닝 모델 기반 유튜브 스팸 댓글 탐지 (Ensemble Machine Learning Model Based YouTube Spam Comment Detection)

  • 정민철;이지현;오하영
    • 한국정보통신학회논문지
    • /
    • 제24권5호
    • /
    • pp.576-583
    • /
    • 2020
  • 이 논문은 최근 엄청난 성장을 하고 있는 유튜브의 댓글 중 스팸 댓글을 판별하는 기법을 제안한다. 유튜브에서는 광고를 통한 수익 창출이 가능하기 때문에 인기 동영상에서 자신의 채널이나 동영상을 홍보하거나 영상과 관련 없는 댓글을 남기는 스패머(spammer)들이 나타났다. 유튜브에서는 자체적으로 스팸 댓글을 차단하는 시스템을 운영하고 있지만 여전히 제대로 차단하지 못한 스팸 댓글들이 있다. 따라서, 유튜브 스팸 댓글 판별에 대한 관련 연구들을 살펴 보고 인기 동영상인 싸이, 케이티 페리, LMFAO, 에미넴, 샤키라의 뮤직비디오 댓글 데이터에 6가지 머신러닝 기법(의사결정나무, 로지스틱 회귀분석, 베르누이 나이브 베이즈, 랜덤 포레스트, 선형 커널을 이용한 서포트 벡터 머신, 가우시안 커널을 이용한 서포트 벡터 머신)과 이들을 결합한 앙상블 모델로 스팸 탐지 실험을 진행하였다.

사물인터넷 디바이스의 집적회로 목적물과 소스코드의 유사성 분석 및 동일성 (Similarity Evaluation and Analysis of Source Code Materials for SOC System in IoT Devices)

  • 김도현;이규대
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권1호
    • /
    • pp.55-62
    • /
    • 2019
  • 사물인터넷 디바이스의 소형화, 저전력화 요구는 프로그램을 단일 칩으로 구현하는 SOC 기술로 구현되고 있다. 불법 복제에 의한 저작권 분쟁은 반도체 칩에서도 증가하고 있으며, 디자인하우스의 칩 구현에서의 분쟁과 소스코드의 도용에 의한 칩 구현에 발생하고 있다. 그러나 최종 칩 구현은 디자인하우스에서 제작되기 때문에 저작권의 보호범위에서 어려움이 있다. 본 연구에서는 사물인터넷 디바이스의 집적회로에서 HDL 언어로 작성된 소스코드의 분쟁에서, 유사성을 판단하기 위한 분석방법과 유사성 판단의 기준을 설정하는 항목에 대해 다루었다. 특히 동일한 시방서를 기준으로 제작된 칩의 경우 동일한 구성과 코드 형태를 포함해야 하는 제작특성에서 유사성의 판단영역을 구분하는 내용에 대해서도 다룬다.

애널리스트 보고서 텍스트의 주가예측력에 대한 검증 (Verification on stock return predictability of text in analyst reports)

  • 이영선;야마다 아키히코;양철원;노호석
    • 응용통계연구
    • /
    • 제36권5호
    • /
    • pp.489-499
    • /
    • 2023
  • 온라인 플랫폼을 통한 애널리스트 보고서의 공유가 가능해짐에 따라 애널리스트들이 생성한 보고서는 시장 참여자들 간 금융 정보 격차를 줄일 수 있는 유용한 도구가 되었으며, 애널리스트 보고서의 정량적 정보가 주식수익률 예측에 다수 활용되었다. 하지만 상대적으로 애널리스트 보고서 내 텍스트 정보의 주식수익률 예측 정보력에 대한 국내 자료 기반 연구는 상대적으로 많이 부족하다. 본 연구는 애널리스트 보고서에서 추출 가능한 텍스트로부터 어조 변수를 생성하여 주식수익률 예측에 정보력이 있는지를 검증하되, 기존 연구들의 선형모형 가정 기반 검정의 한계를 해결하고자 랜덤 포레스트 기반의 F-test를 사용하여 기업수익률 예측력을 검증하였다.

터널 갱구사면 쏘일네일링 보강배치계획을 위한 최적화기법 연구 (A study on the optimization technique for the plan of slope reinforcement arrangement of soil-nailing in tunnel portal area)

  • 김병찬;문현구
    • 한국터널지하공간학회 논문집
    • /
    • 제18권6호
    • /
    • pp.569-579
    • /
    • 2016
  • 국내 터널 갱구사면에 안정성을 확보하기 위한 사면보강은 앵커, 쏘일네일 및 록볼트 등을 이용한 다양한 공법이 사용되고 있다. 갱구 사면보강공법 및 보강재 배치, 보강재 길이 등을 선정하기 위해서는 시행착오법 등 시간이 많이 소요되기도 하며, 최적조건의 상태가 선정되었는지에 대한 검증이 쉽지 않은 경우도 발생한다. 본 연구에서는 FLAC3D 프로그램에 내장된 FISH 언어를 사용해서, 차분진화 알고리즘(DEA)을 적용한 최적화기법을 개발하였다. 갱구사면 보강공법 중에 쏘일네일링 공법에 대한 데이터베이스를 구축한 후, FLAC3D 해석을 통한 안전율 기반의 최적보강배치 계획을 선정할 수 있도록 하였다. 수치해석 결과, 완전조합(FC)에 비해서 DEA 기반의 최적화기법이 해석회수가 8배 정도 감소함을 확인하였다. 갱구 사면보강 설계 시 개발된 시스템을 활용하면, 최적보강배치 계획을 상대적으로 쉽게 선정할 수 있을 것으로 기대된다.

융합 기술을 활용한 '교육 2.0' 서비스 사례조사와 네트워크 아키텍처 분석에 관한 연구 (A study for 'Education 2.0' service case and Network Architecture Analysis using convergence technology)

  • 강장묵;강성욱;문송철
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권4호
    • /
    • pp.759-769
    • /
    • 2008
  • 개방-API, 매쉬업, 신디케이션 등 웹 2.0의 참여 공유 개방을 촉진시키는 융합기술이 교육 분야에도 변화를 주고 있는데, 교육 분야에서의 융합은 '교육 2.0'으로의 진화를 뜻하며 이러한 웹 2.0의 사조가 반영된 기술 환경에서의 새로운 교육을 '교육 2.0'이라고 지칭한다. 교육 환경은 학습자, 교육자 그리고 교육기관 간의 긴밀한 소셜 네트워크의 공간이다. 온톨로지 언어로 개발된 디지털 관계망 기술은 개인화된 교육 서비스와 맥락을 이해한 시맨틱한 교육을 가능하게 한다. 특히 아마존의 평판 시스템, 위키피디아의 집단지성에 의한 여과시스템 등은 학습자가 교육의 주체로서 참여의 역할을 넓히고 쌍방향적인 대등한 커뮤니케이션을 가능하게 한다. 우리나라의 경우 웹 2.0 사상을 반영한 '교육 2.0' 서비스는 현재 운영되지 않고 있는데, 이는 단순한 시스템 최신화의 수준이 아니라 교육하는 방법과 기술에 대한 다양한 함의를 가지기 때문이다. 따라서 '교육 2.0' 서비스가 실현되기 위하여 아직 적극적으로 검토되지 않은 '교육 2.0'의 개념을 융합 기술의 문맥으로 분석할 필요가 있다. 웹 2.0 기술과 교육 콘텐츠가 융합하기 위해 콘텐츠간의 연결에 있어서 새로운 네트워크 아키텍처를 소개하고 이의 활용과 분석을 하였다. 본 연구는 '교육 2.0'을 실현하기 위하여 융합 기술을 활용한 네트워크 아키텍처와 '교육 2.0' 서비스를 고찰하고 분석함으로써 향후 '교육 2.0' 플랫폼 구축에 선행 연구로 활용될 것으로 전망한다.

  • PDF

인트라넷에서 가상데이터베이스를이용한 데이터베이스 검색 시스템의 설계 (Design for Database Retrieval System using Virtual Database in Intranet)

  • 이동욱;박영배
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1404-1417
    • /
    • 1998
  • 현재 웹을 통하여 인터넷 데이터베이스를 검색하는 방법에는 검색 엔진 기술을 이용한 방법과, 둘째 플러그인 기술이나 엑티브엑스 기술을 이용한 검색 방법으로 나눌 수 있다. 검색 엔진을 이용하는 방법은 단순 문서와 같은 대량의 텍스트 데이터를 키워드와 같은 인덱스를 구축하고 이를 이용하여 검색하는 방법으로서, 문제점은 하나 이상의 데이터베이스를 동시에 검색하지 못하고 또 질의어와 같은 다양한 형태의 조건 검색을 할 수가 없으며, 사용자의 요구에 맞지 않는 데이터가 많이 전송된다는 즉, 정확성이 낮다는 세 가지 점을 들 수 있다. 플러그인 기술이나 액티브엑스 기술을 이용하는 방법은 웹 화면상에서 DBMS를 이용하여 클라이언트의 질의를 실행시켜 데이터베이스를 검색하는 방법으로서, 문제점은 동일한 데이터모델의 경우라도 하나 이상의 DBMS를 동시에 기동시킬 수 없고 또 클라이언트 프로그램에서 미리 정의된 질의 이외의 다양한 종류의 질의를 할 수 없다는 두 가지 점을 들 수 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해서 인터넷/인트라넷상에서 새로운 개념으로 작성한 가상데이터베이스를 이용하여 웹 화면을 통해서 다양한 종류의 질의를 직접 할 수 있는 데이터베이스 검색 시스템을 설계하는 데에 있다. 여기서, 가상데이터베이스는 동일한 관계데이터 모델로서 하나 이상의 관계 DBMS를 사용하는 것으로 가정한다.

  • PDF

대용량 DEM 데이터의 효율적 압축을 위한 DEM_Comp 소프트웨어 개발 (DEM_Comp Software for Effective Compression of Large DEM Data Sets)

  • 강인구;윤홍식;위광재;이동하
    • 한국측량학회지
    • /
    • 제28권2호
    • /
    • pp.265-271
    • /
    • 2010
  • 본 논문에서는 대용량의 수치표고모델(DEM) 데이터의 효율적인 압축을 위해 허프만 코딩과 Lempel-Ziv-Welch 압축방법을 기반으로 하는 새로운 DEM 압축 소프트웨어인 DEM_Comp를 개발하였다. DEM_Comp의 개발을 위해서 $C^{++}$ 언어를 이용하였으며, 모든 Window 플랫폼에서 사용이 가능하도록 하였다. 개발된 소프트웨어의 성능을 평가하기 위해 다양한 지형의 형태를 가지는 DEM에 대해 압축을 수행하고, 출력파일의 용량에 따른 압축효율을 평가하였다. 최근 새로운 지형데이터 취득장비인 LiDAR와 SAR 등에 의해 고해상도의 DEM의 활용이 급격하게 증가하고 있어, 데이터의 저장용량과 전송대역폭을 감소시킬 수 있는 DEM 압축기술이 매우 유용하게 이용되고 있다. 일반적으로 데이터 압축기술은 i) 데이터 사이의 관계를 분석하고, ii) 분석 결과에 따라 압축 및 저장기술을 결정하는 2부분으로 구성되는데, DEM_Comp에서는 정규격자, Lempel-Ziv 압축방법, 허프만 코딩의 3단계 압축 알고리즘을 통해 DEM이 압축된다. DEM_Comp의 압축효율 실험 결과 전처리만 수행하였을 경우 지형의 기복과 상관없이 압축효율은 약 83% 정도를 나타내었지만, 3단계의 압축 알고리즘이 완료된 경우에는 압축효율이 97%까지 증가하는 것으로 나타났다. 이러한 수치는 일반적인 상업용 압축 소프트웨어들과 비교하여 약 14% 정도의 압축효율이 향상되었음을 나타낸다. 이에 따라 본 연구에서 개발된 DEM_Comp S/W를 이용하면 대용량의 고해상도 DEM의 관리, 저장, 배포를 보다 효율적으로 수행할 수 있을 것으로 판단된다.

사랑의 변주곡에 대한 기호학적 접근 (A Semiological Study of Kim Soo-Young′s ″A Variation of Love″)

  • 한명희
    • 인문언어
    • /
    • 제1권2호
    • /
    • pp.47-63
    • /
    • 2001
  • "A Variation of Love" is a characteristic Kim Soo-Young poem, in that it embodies the poet′s innovative use of language and proceeds speedily, like many of his other poems. Above all, the poem reveals the core of Kim′s poetical spirit, his speculation about love. The poem is difficult to understand because it broadly uses run-on lines and even run-on stanzas, a technique that many readers are unfamiliar with. The semiological approach of this paper will bring new light on the poem by restructuring the relationship between signs, that is, by taking apart the sign system of the original text and reconstructing its sentence structure. If we rearrange the poem from its original six stanzas and fifty-one lines to four stanzas and twenty-three lines, we will discover a close connection between stanzas 1 and 2, and between stanzas 3 and 4. Of the many keywords of the poem, we may establish the dominant word as "love," into which every poetic word converges and from which each word emanates. Another important keyword is "fatigue of the city" in stanza 4. Similarly negative aspects of the city may be found in the line "the same may be said of Bombay, of New York, of Seoul" in stanza 3, as well as in the words "desire" in combination with "the lamplights of Seoul like leftovers in the pig sty" in stanza 1. The persona of the poem tries to overcome the "fatigue of the city" by "love," but the way he realizes love is, somewhat peculiarly, through stillness and silence. The persona aligns "the stones of the peach and the apricot and the dried persimmon" with the his faith in love. He calls the stones "beautiful hardness" presumably because that hardness (the stillness and silence) may blossom into beauty. In the earlier stanzas, the persona′s quest for love results in an awareness that love is omnipresent, but the persona determines "not to shout it out loud." The reason for this determination is found in stanza 4. Those who experience the "fatigue of the city" will be able to realize it by themselves. This seemingly defeatist conclusion by no means suggest pessimism, for the persona holds the conviction that "there will come a day when [one] will rave for love." This conviction rescues the poem from the dismal mood suggested by the "fatigue of the city." At all events, it is important to note that the "fatigue of the city" should not be considered apart from "love." Yet, strangely enough, the poem embodies a severe critique of the city, and further investigation is necessary in order to clarify why this critique appears in the form of "love." But this will be the treated in another paper.

  • PDF

온라인 커뮤니티에서 보여지는 노령화 사회의 단면: 대화 방식과 사용 언어의 변화에 대한 탐색적 연구 (A Reflection of Aging Society in Online Communities: An Exploratory Study on Changes in Conversation Style and Language Usage)

  • 이정;한진영;함주연
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.51-68
    • /
    • 2023
  • 1990년대 말 인터넷의 등장과 함께 시작된 온라인 커뮤니티의 활용기간이 사반세기를 넘어가면서, 사용자층의 평균 연령도 함께 높아지고 있다. 본 연구는 온라인 커뮤니티의 사용자 연령이 높아지면서 말투에 어떠한 변화가 일어났는지 탐색한다. 이를 위해 신규회원의 가입이 9년 전 중지되었으나 기존 회원만으로 2023년 현재까지 여전히 활발하게 운영 중인 한 온라인 커뮤니티에서 2012년부터 2022년까지 총 11년간의 게시물을 수집, 분석하였다. 그 결과, 사용자의 연령층이 높아짐에 따른 평균 댓글수의 증가, 의문문의 감소, 명령지시어의 감소 등을 확인하였다. 그리고 이러한 변화의 원인으로서 노화로 인한 외로움의 증가, 호기심과 자신감의 하락 등을 제시하였다. 세계적으로 유례없이 빠르게 고령화 사회로 진입하고 있는 대한민국에서는 이전까지는 각 개인들이 감내하던 외로움과 고독감이 1인 가구의 증가라는 사회적 현상과 더불어 고독사와 은둔형 외톨이의 증가라는 사회적 문제로 진화하고 있다. 본 연구는 이러한 대한민국 사회 변화의 한 단면을 대형 온라인 커뮤니티의 게시물 분석을 통해 보여주면서 향후 어떠한 방향으로 이러한 문제들이 논의되어야 할지 생각해본다.

경극(京劇) $\ll$독목관(獨木關)$\gg$의 연개소문(淵蓋蘇文) 무대의상(舞台衣裳) 디자인 연구(硏究) - 무대의상(舞台衣裳)의 상징적(象徵的) 의미(意味)를 중심(中心)으로 - (A Study on Stage Costume of Yean-GaeSoMoon(Korean) in the Peking Opera <> - Focusing on Symbolic Meaning of Stage Costume -)

  • 신경섭;조규화
    • 패션비즈니스
    • /
    • 제2권3호
    • /
    • pp.121-136
    • /
    • 1998
  • The purpose of this study was to present a new research method of stage costume by designing and making the stage costume of Yean-GaeSoMoon(淵蓋蘇文) in Peking Opera Du Mu Guan (Korean; Dog Mog Guan, 獨木關). The stage costume of Peking Opera was formed on the basis of the Chinese traditional stage costume in the Qing period, however the style of stage costume was beautified the costume of Ming period and here contained the factors of successive costumes. But the stage costume of Peking Opera didn't have the same rank system with real history costume and didn't have demarcation according to period and history. In the stage costume of Peking Opera, the color is cultural language that can inform spectators of sex, age, personality, position of characters. The pattern of decoration also symboled the personality and characteristic of the character. Yean-GaeSoMoon in the play wore green armour (Chinese; ru ying kao 綠硬靠), red pants (Chinese; hong ku 紅褲), red mustache (Chinese; hong ran kou 紅髥口), crown (Chinese; da e zi 大額子), shoes (Chinese; hou di xue 厚底靴) and Xue RenGui wore white armour (Chinese; baikao 白靠), red pants (Chinese; hong ku 紅褲), shoes (Chinese; hou di xue 厚底靴), hat (Chinese; za jin 扎巾). By historical materials, Yean-GaeSoMoon was a nationalist who uphold national sprit and the greatest hero of the age and a charismatic politician who combines literatural arts with military arts. Considering these reviews, defined the thema of his new costumes' image as "the flying bird which has three legs"(三足鳥), the bird which symbolized the sun and immortality in Koguryo fresco. On the basis of this image, presented three types of Yean-GaeSoMoon's stage costume. Yean-GaeSoMoon as the minister in the court wore black gown (Chinese; mang pao 蟒袍) of dargon pattern which symbolizes harisma who opening the heaven. He as the general who directs war wore red mantle (Chinese; dou peng 斗蓬) which symbolizes the blue dragon that soaring into the sky, as the officer who fights the enemy's general wore green armour (Chinese; gai liang jia 改良甲), red pants (Chinese; hong ku 紅褲) which symbolizes the flying Sward that blowing violently. By wearing these stage costumes, the image of Yean-GaeSoMoon could changed from the fierce general of minority race who likes to fight, to the Koguryo general who fights against enemy at the risk of his life for Koguryo's autonomy. Through this study once again we could realized that stage costume played very mportant part In outstnding the characteristic of actor in the Peking Opera.

  • PDF