통합 검색 | Korea Science

A Novel Two-Stage Training Method for Unbiased Scene Graph Generation via Distribution Alignment

Dongdong Jia;Meili Zhou;Wei WEI;Dong Wang;Zongwen Bai
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제17권12호
- /
- pp.3383-3397
- /
- 2023
Scene graphs serve as semantic abstractions of images and play a crucial role in enhancing visual comprehension and reasoning. However, the performance of Scene Graph Generation is often compromised when working with biased data in real-world situations. While many existing systems focus on a single stage of learning for both feature extraction and classification, some employ Class-Balancing strategies, such as Re-weighting, Data Resampling, and Transfer Learning from head to tail. In this paper, we propose a novel approach that decouples the feature extraction and classification phases of the scene graph generation process. For feature extraction, we leverage a transformer-based architecture and design an adaptive calibration function specifically for predicate classification. This function enables us to dynamically adjust the classification scores for each predicate category. Additionally, we introduce a Distribution Alignment technique that effectively balances the class distribution after the feature extraction phase reaches a stable state, thereby facilitating the retraining of the classification head. Importantly, our Distribution Alignment strategy is model-independent and does not require additional supervision, making it applicable to a wide range of SGG models. Using the scene graph diagnostic toolkit on Visual Genome and several popular models, we achieved significant improvements over the previous state-of-the-art methods with our model. Compared to the TDE model, our model improved mR@100 by 70.5% for PredCls, by 84.0% for SGCls, and by 97.6% for SGDet tasks.
https://doi.org/10.3837/tiis.2023.12.009 인용 PDF HTML

자율주행 차량 시뮬레이션에서의 강화학습을 위한 상태표현 성능 비교 (Comparing State Representation Techniques for Reinforcement Learning in Autonomous Driving)

안지환;권태수
- 한국컴퓨터그래픽스학회논문지
- /
- 제30권3호
- /
- pp.109-123
- /
- 2024
딥러닝과 강화학습을 활용한 비전 기반 엔드투엔드 자율주행 시스템 관련 연구가 지속적으로 증가하고 있다. 일반적으로 이러한 시스템은 위치, 속도, 방향, 센서 데이터 등 연속적이고 고차원적인 차량의 상태를 잠재 특징 벡터로 인코딩하고, 이를 차량의 주행 정책으로 디코딩하는 두 단계로 구성된다. 도심 주행과 같이 다양하고 복잡한 환경에서는 Variational Autoencoder(VAE)나 Convolutional Neural Network(CNN)과 같은 네트워크를 이용한 효율적인 상태 표현 방법의 필요성이 더욱 부각된다. 본 논문은 차량의 이미지 상태 표현이 강화학습 성능에 미치는 영향을 분석하였다. CARLA 시뮬레이터 환경에서 실험을 수행하였고, 차량의 전방 카메라 센서로부터 취득한 RGB 이미지 및 Semantic Segmented 이미지를 각각 VAE와 Vision Transformer(ViT) 네트워크로 특징 추출하여 상태 표현 학습에 활용하였다. 이러한 방법론이 강화학습에 미치는 영향을 실험하여, 데이터 유형과 상태 표현 기법이 자율주행의 학습 효율성과 결정 능력 향상에 어떤 역할을 하는지를 실험하였다.
https://doi.org/10.15701/kcgs.2024.30.3.109 인용 PDF

규칙기반 한글 자동 프로그램을 위한 프로그램 변형기법 (A Program Transformational Approach for Rule-Based Hangul Automatic Programming)

홍성수;이상락;심재홍
- 한국정보처리학회논문지
- /
- 제1권1호
- /
- pp.114-128
- /
- 1994
초고급 언어에 의한 자동 프로그래밍은 프로그램의 자료구조 이외에 많은 부분을 시스템이 관장함으로써 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술 어논리, 집합, 사상, 혹은 제안된 자연언어를 사용하기 때문에 초고급 구조에 익숙하 지 않은 프로그래머들이 이를 이용하여 프로그램을 작성하는 경우 상당한 어려움이 따 르고, 이들 초고급언어 구조에 익숙하기까지 많은 시간이 요하게 된다. 왜냐하면 초 고급언어는 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술어 논리, 집합, 사상, 혹은 제한된 자연언어를 사용하기 때문이다. 본 논문에서는 기존의 자동 프로 그램의 어려움을 줄이기 위해서 한글로 구성된 선언적구문, 절차적 구문, aggregate 구문으로 광역언어를 설계하고 구현한다. 본 논문에서는 제안하는 한글 자동 프로그래 밍 시스템(Hangul Automatic Programming)은 입력으로 순수한 한글로 구성되어 있으며 추상 알고리즘(Abstract Algorithm)과 자료형(Data Type)혹은 절차적 구문을 받아서 출력으로는 C 언어 프로그램을 만들어 낸다. 자동 프로그래밍 접근 방식은 프로그램 변형기법과 규칙기반에 바탕을 두고 문제영역은 일반적인 프로그램으로 한정 하였다. 시스템 제어구조는 한글 프로그램을 입력으로 받아서 지식베이스로부터 적절한 규칙 을 선택해서 이것을 변형한 다음 전체 데이타 베이스에 넣는데 이과정을 프로그램이 완성 될 때 까지 반복한다.
PDF

데이터마이닝 기술을 이용한 한국과학기술인용색인DB 활용 방안 연구 (A Study on Utilization of Korea Science Citation Database(KSCD) Based on Data Mining Techniques)

박종현;최선희;김병규
- 정보관리연구
- /
- 제43권4호
- /
- pp.191-210
- /
- 2012
한국과학기술정보연구원(KISTI)에서는 대량의 학술 정보들을 분류하여 저장하고 관리하기 위한 한국과학기술 인용색인 데이터베이스(KSCD)를 구축한 바 있다. 그러나 학술인용색인데이터들은 그 특성상 단순히 저장만을 위한 자료가 아니다. 즉, 저장된 데이터를 기반으로 사용자들에게 어떠한 서비스를 어떻게 제공할 것인지는 KSCD의 활용 측면에서 매우 중요한 문제이다. 예를 들어 사용자는 단순히 특정 저자가 기술한 학술 자료들을 검색하기를 원할 수도 있지만, 필요에 따라 해당 저자와 유사한 연구를 수행하는 저자들을 검색하기를 원할 것이다. 그러나 단순히 저장된 데이터만으로 이러한 서비스를 제공하기는 어렵다. 그러므로 본 논문에서는 한국과학기술인용색인 데이터베이스(KSCD)를 향후 어떻게 활용할 수 있는가에 대한 해답을 찾기 위해서는 국내외에서 현재 어떠한 서비스들을 제공하고 있는지 살펴보고 이와 관련하여 어떤 방향으로 연구가 진행해야 하는지를 모색한다. 특별히 데이터 마이닝 기술은 다양한 형태의 데이터로부터 데이터 속에 내포되어있는 특징(Feature)들을 추출하고 새로운 데이터 모델을 발견하여 의미 있는 정보를 추출해 내어 결국은 사용자의 의사 결정에 도움을 주는 것을 그 목적으로 한다. 즉 데이터에 숨겨진 패턴과 관계를 찾아내어 유용한 정보를 발견해 내는 것이다. 그러므로 본 논문에서는 이러한 데이터마이닝 기법을 학술인용색인데이터에 적용하여 제공할 수 있는 서비스들이 무엇이 있는지 논의한다.
https://doi.org/10.1633/JIM.2012.43.4.191 인용 PDF KSCI KPUBS

중학생이 인식하는 특성화 고등학교 이미지 분석 (Image analysis of Specialized Vocational high school recognized by middle school student)

김영훈;김태훈
- 대한공업교육학회지
- /
- 제38권2호
- /
- pp.114-135
- /
- 2013
이 연구의 목적은 중학생의 배경 변인에 따른 특성화고의 이미지를 조사하여 특성화고에 대한 인식을 확인함으로써, 특성화고의 올바른 인식 확대 방안 및 발전방안 마련에 기초 자료를 제공하는 것이다. 연구의 모집단은 전국 중학교 3학년 학생이며, 2012년 교육통계연보를 기준으로 하였다. 협조를 허락해주신 학교를 대상으로 편의표집을 통한 학급 선정을 통해 최종적으로 50개의 학교에 3학년 한 학급씩을 선정하였다. 자료의 수집을 위한 조사 도구로는 Osgood(1957)이 제안한 의미분별법을 사용하여 최종적으로 11개의 형용사 군을 선정하였다. 자료의 수집은 방문과 우편을 통하여 이루어졌고, 총 1,441매의 설문지가 배포되어 그 중 1,198매가 회수되어 83.14%의 회수율을 나타냈으며, 이 중 불성실한 응답을 제외한 935매의 설문지가 분석에 활용되었다. 수집된 자료는 SPSS 20 Statistics 프로그램을 사용하여 분석하였다. 이때 통계적 유의수준은 0.05로 설정하였다. 이 연구의 주요 결론은 다음과 같다. 첫째, 성별에 따른 특성화고 이미지의 평균은 여학생이 남학생보다 긍정적이었으나 유의미한 차이는 11개 항목 중에서 5개 항목에서만 나타났다. 둘째, 특성화 고등학교에 대한 진로 교육을 받은 학생은 20%에 불과하였다. 보다 빠른 진로에 대한 탐색과 적성에 맞는 진로 결정이 이루어지기 위하여 중학교 단계에서부터 진로 교육이 제대로 이루어져야 한다. 셋째, 특성화 고등학교 진학을 희망하는 학생들의 이미지가 다른 고교 진학을 희망한 학생보다 특성화 고등학교에 대하여 9개 항목에서 긍정적인 이미지를 가지고 있는 유의미한 차이가 나타났다. 넷째, 진로 교육 유무별 특성화고 이미지 차이에서도 8개의 항목에서 유의미한 차이가 나타났는데, 특성화 고등학교에 대한 진로 교육이 확대될 필요성이 있음을 나타내는 것이다. 다섯째, 특성화 고등학교에 대한 인지의 차이에 따른 특성화고 이미지 차이에서는 7개 항목에서 특성화 고등학교에 대하여 잘 알고 있을수록 특성화 고등학교에 대한 이미지가 긍정적이었다. 이는 진로 교육이나 홍보 활동을 통하여 특성화 고등학교에 대한 인식의 폭을 증대시켰을 때, 그에 따른 효과가 긍정적이라는 것을 의미한다.
PDF KSCI

효율적인 이미지 분할을 위한 RGB 채널 선택 기법 (RGB Channel Selection Technique for Efficient Image Segmentation)

김현종;박영배
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제31권10호
- /
- pp.1332-1344
- /
- 2004
최근 초고속 통신망 및 멀티미디어 관련기술의 발달로 인해 멀티미디어 데이타를 좀 더 효율적으로 전송하고 저장, 검색하는 기술이 요구되고 있다. 그 중에서 의미 기반 영상 검색은 색상, 질감, 모양 정보 등의 저 차원 특징 정보와 이미지 데이타에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키 워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 두 번째 문제점으로 내용 기반이미지 검색시스템에서 검색 성능이 떨어지며, 복잡한 배경을 가진 이미지에서 객체를 분리하기가 어렵고, 그리고 영역의 과잉 분할로 인하여 영역 추출이 어렵다. 그리고 복잡한 다중 객체를 가진 이미지에서 객체들을 분리하기 어렵다는 것이다. 이러한 문제점들을 해결하기 위해서, 본 논문에서는 총 다섯 가지 단계로 처리할 수 있는 내용 기반 검색 시스템을 구축한다. 다섯 단계 중에서 가장 중요한 부분은 RGB 이미지들 중에서 배경이 가장 큰 것과 가장 작은 것을 추출한다. 특히, 배경이 가장 큰 이미지를 이용하여 피사체와 배경을 추출하는 방법을 제안한다. 두 번째 문제점을 해결하기 위해서, RGB 채널 분할 기법을 이용하여 객체를 분리하고, Watermerge의 임계값을 이용하여 영역의 과잉분할을 최적화하며, RGB 채널 선택 기법을 이용하여 다중객체를 분리하는 방법을 제안한다. 실험을 통하여 기존에 검색하기 어려웠던 복잡한 객체들을 검색하는 방법들을 대체할 수 있도록, 제안한 기법이 기존의 방법보다 검색 성능이 우수함을 입증한다.과 황산이온의 농도에 따르는 것으로 생각된다. 이상과 같이, 에트린자이트는 콘크리트 내에서 다양한 내외부적인 화학작용 따라 특징적인 산출 양상을 보이며, 주변 환경 조건에 따라 다른 광물로 전이되는 나타내었다. 이러한 연구결과, 에트린자이트의 생성에 따른 콘크리트의 성능저하는 그 광물학적 특성과 분포양상에 관련성을 가지는 것으로 나타났다.인 상관관계를 보이지 않는 것으로 나타난다. 이에 비해서 팽윤도는 벤토나이트의 광물조성, 표면전하 특성, 입도 및 형상 등의 물리화학적 성향을 포괄하는 체표면적 수치와 대략적으로 반비례적인 관계를 보인다 따라서 벤토나이트 현탁액에서의 유변학적 특성은 몬모릴로나이트의 표면전하 특성, 형태, 입도 및 조직 등의 차이에 의해서 달라지는 점토 입자들의 응집특성 및 취합결정체의 형상에 주로 규제되고, 제올라이트와 같은 미세한 불순 광물성분들의 영향도 부수적으로 관여되는 복합적인 성향인 것으로 해석된다.18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한
PDF KSCI

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석 (Sentiment analysis on movie review through building modified sentiment dictionary by movie genre)

이상훈;최정;김종우
- 지능정보연구
- /
- 제22권2호
- /
- pp.97-113
- /
- 2016
인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.
https://doi.org/10.13088/jiis.2016.22.2.097 인용 PDF KSCI

텍스트마이닝을 활용한 북한 관련 뉴스의 기간별 변화과정 고찰 (An Investigation on the Periodical Transition of News related to North Korea using Text Mining)

박철수
- 지능정보연구
- /
- 제25권3호
- /
- pp.63-88
- /
- 2019
북한의 변화와 동향 파악에 대한 연구는 북한관련 정책에 대한 방향을 결정하고 북한의 행위를 예측하여 사전에 대응 할 수 있다는 측면에서 매우 중요하다. 현재까지 북한 동향에 대한 연구는 전문가를 중심으로 과거 사례를 서술적으로 분석하여, 향후에 북한의 동향을 분석하고 대응하여 왔다. 이런 전문가 서술 중심의 북한 변화 및 동향 연구에서 비정형데이터를 이용한 텍스트마이닝 분석이 더해지면 보다 과학적인 북한 동향 분석이 가능할 것이다. 특히 북한의 동향 파악과 북한의 대남 관련 행위와 연관된 연구는 통일 및 국방 분야에서 매우 유용하며 필요한 분야이다. 본 연구에서는 북한의 신문 기사 내용을 활용한 텍스트마이닝 방법으로 북한과 관련한 핵심 단어를 구축하였다. 그리고 본 연구는 김정은 집권 이후 최근의 남북관계의 극적인 관계와 변화들을 기반으로 세 개의 기간을 나누고 이 기간 내에 국내 언론에 나타난 북한과 관련성이 높은 단어들을 시계열적으로 분석한 연구이다. 북한과 관련한 주요 단어들을 세 개의 기간별로 분류하고 당시에 북한의 태도와 동향에 따라 해당 단어와 주제들의 관련성이 어떻게 변화하였는지를 파악하였다. 본 연구는 텍스트마이닝을 이용한 연구가 남북관계 및 북한의 동향을 이해하고 분석하는 방법론으로서 얼마나 유용한 것이지를 파악하는 것이었다. 앞으로 북한의 동향 분석에 대한 연구는 물론 대북관계 및 정책에 대한 방향을 결정하고, 북한의 행위를 사전에 예측하여 대응 할 수 있는 북한 리스크 측정 모델 구축을 위한 연구로 진행 될 것이다.
https://doi.org/10.13088/jiis.2019.25.3.063 인용 PDF KSCI

코로나19 사태와 온라인 정보의 다양성 연구 - 빅데이터를 활용한 글로벌 접근법 (Online Information Sources of Coronavirus Using Webometric Big Data)

박한우;김지은;주우붕
- 한국산학기술학회논문지
- /
- 제21권11호
- /
- pp.728-739
- /
- 2020
이 연구는 웹보메트릭 빅데이터를 활용하여 코로나바이러스 확진 국가(지역)들의 온라인 정보원의 다양성을 조사했다. 구체적으로 2020년 2월에 코로나바이러스 확진자가 발생한 28개국을 대상으로 웹 데이터를 수집한 결과, 호주, 캐나다, 이탈리아 등의 온라인 가시성이 높게 나타나면서 관련 정보를 가장 많이 생산하고 있었다. 국가별 검색건수(hit counts)와 정보채널의 역할을 하는 도메인(domain) 빈도와는 통계적으로 유의한 상관성이 있었다. 한편 데이터 수집도구인 bing.com의 점유률이 평소에도 높은 국가들을 제외하고 다시 검토한 결과, 당시 확진자 수가 많았던 일본, 중국, 싱가포르 등이 코로나바이러스와 관련된 웹데이터를 주도적으로 올리고 있었다. 온라인 정보원은 n-헬릭스를 활용하여 분류되었다. n-헬릭스는 대학-기업-정부의 3주체간 상호작용과 혁신을 강조하는 트리플헬릭스모델(Triple Helix Model)에 기반한 확장된 분석틀이다. 그 결과, 정부기관이 18.1%를 차지하면서 코로나바이러스 정보의 최대 공급자로 나타났다. 2원성 네트워크 분석결과를 보면 언론사, 대학병원, 공중보건에 특화된 조직 등도 코로나바이러스 연구와 방역 정보의 온라인 유통에 적극적이었다. 웹페이지에 포함된 단어들을 중심으로 내용분석을 해 보니 건강, 학교, 가족, 공공, 방안 등의 단어가 중심성이 높게 나타나 코로나바이러스로 인한 개인별 예방수칙뿐만 아니라 생활 불편과 업무장애로 인한 대처방안 등에 관심이 높다는 것을 알 수 있었다.
https://doi.org/10.5762/KAIS.2020.21.11.728 인용 PDF KSCI

저차원 선형 모델을 이용한 하이브리드 협력적 여과 (A Hybrid Collaborative Filtering Using a Low-dimensional Linear Model)

고수정
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제36권10호
- /
- pp.777-785
- /
- 2009
협력적 여과는 특별한 아이템에 대한 사용자의 선호도를 예측하는 데 사용하는 기술이다. 이러한 협력적 여과 기술은 사용자 기반 접근 방식과 아이템 기반 접근 방식으로 구분할 수 있으며, 많은 상업적인 추천 시스템에서 광범위하게 사용되고 있다. 본 논문에서는 저차원 선형 모델을 사용하여 사용자 기반과 아이템 기반을 통합하는 하이브리드 협력적 여과 방법을 제안한다. 제안한 방법에서는 저차원 선형모델 중 비음수 행렬 분해(NMF)를 이용하여 기존의 협력적 여과 시스템의 문제점인 희박상과 대용량성의 문제점을 해결한다. 협력적 여과 시스템에서 NMF를 이용하는 방법은 사용자를 의미 관계로 표현할 때 유용하게 사용되나 사용자-아이템 행렬의 평가값에 따라 정확도가 낮아질 수 있으며, 모델 기반의 방법이기 때문아 계산 과정이 복잡하여 동적인 추천이 불가능하다는 단점을 갖는다. 이러한 단점을 보완하기 위하여 제안된 방법에서는 NMF에 의해 군집된 그룹을 대상으로 TF-lDF를 이용하여 그룹의 특징을 추출한다. 또한, 아이템 기반에서 아이템간의 유사도를 계산하기 위하여 상호정보량(mutual information)을 이용한다. 오프라인 상에서 훈련집합의 사용자를 군집시키고 그룹의 특징을 추출한 후, 온라인 상에서 추출한 그룹의 특징을 이용하여 새로운 사용자를 가장 최적의 그룹으로 분류함으로써 사용자를 분류하는 데 걸리는 시간을 단축시켜 동적인 추천을 가능하게 하며, 사용자 기반과 아이템 기반을 병합함으로써 기존의 방법보다 정확도를 높인다.
PDF KSCI

검색결과 295건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)