• 제목/요약/키워드: Data annotation

검색결과 258건 처리시간 0.024초

Validation of exercise-response genes in skeletal muscle cells of Thoroughbred racing horses

  • Kim, Doh Hoon;Lee, Hyo Gun;Sp, Nipin;Kang, Dong Young;Jang, Kyoung-Jin;Lee, Hak Kyo;Cho, Byung-Wook;Yang, Young Mok
    • Animal Bioscience
    • /
    • 제34권1호
    • /
    • pp.134-142
    • /
    • 2021
  • Objective: To understand the athletic characteristics of Thoroughbreds, high-throughput analysis has been conducted using horse muscle tissue. However, an in vitro system has been lacking for studying and validating genes from in silico data. The aim of this study is to validate genes from differentially expressed genes (DEGs) of our previous RNA-sequencing data in vitro. Also, we investigated the effects of exercise-induced stress including heat, oxidative, hypoxic and cortisol stress on horse skeletal muscle derived cells with the top six upregulated genes of DEGs. Methods: Enriched pathway analysis was conducted using the Database for Annotation, Visualization, and Integrated Discovery (DAVID) tool with upregulated genes in horse skeletal muscle tissue after exercise. Among the candidates, the top six genes were analysed through geneMANIA to investigate gene networks. Muscle cells derived from neonatal horse skeletal tissue were maintained and subjected to exercise-related stressors. Transcriptional changes in the top six genes followed by stressors were investigated using quantitative reverse transcription-polymerase chain reaction (qRT-PCR). Results: The inflammation response pathway was the most commonly upregulated pathway after horse exercise. Under non-cytotoxic conditions of exercise-related stressors, the transcriptional response of the top six genes was different among types of stress. Oxidative stress yielded the most similar expression pattern to DEGs. Conclusion: Our results indicate that transcriptional change after horse exercise in skeletal muscle tissue strongly relates to stress response. The qRT-PCR results showed that stressors contribute differently to the transcriptional regulation. These results would be valuable information to understand horse exercise in the stress aspect.

Expression of anoctamin 7 (ANO7) is associated with poor prognosis and mucin 2 (MUC2) in colon adenocarcinoma: a study based on TCGA data

  • Chen, Chen;Siripat Aluksanasuwan;Keerakarn Somsuan
    • Genomics & Informatics
    • /
    • 제21권4호
    • /
    • pp.46.1-46.10
    • /
    • 2023
  • Colon adenocarcinoma (COAD) is the predominant type of colorectal cancer. Early diagnosis and treatment can significantly improve the prognosis of COAD patients. Anoctamin 7 (ANO7), an anion channel protein, has been implicated in prostate cancer and other types of cancer. In this study, we analyzed the expression of ANO7 and its correlation with clinicopathological characteristics among COAD patients using the Gene Expression Profiling Interactive Analysis 2 (GEPIA2) and the University of Alabama at Birmingham CANcer (UALCAN) databases. The GEPIA2, Kaplan-Meier plotter, and the Survival Genie platform were employed for survival analysis. The co-expression network and potential function of ANO7 in COAD were analyzed using GeneFriends, the Database for Annotation, Visualization and Integrated Discovery (DAVID), GeneMANIA, and Pathway Studio. Our data analysis revealed a significant reduction in ANO7 expression levels within COAD tissues compared to normal tissues. Additionally, ANO7 expression was found to be associated with race and histological subtype. The COAD patients exhibiting low ANO7 expression had lower survival rates compared to those with high ANO7 expression. The genes correlated with ANO7 were significantly enriched in proteolysis and mucin type O-glycan biosynthesis pathway. Furthermore, ANO7 demonstrated a direct interaction and a positive co-expression correlation with mucin 2 (MUC2). In conclusion, our findings suggest that ANO7 might serve as a potential prognostic biomarker and potentially plays a role in proteolysis and mucin biosynthesis in the context of COAD.

Development of an unsupervised learning-based ESG evaluation process for Korean public institutions without label annotation

  • Do Hyeok Yoo;SuJin Bak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.155-164
    • /
    • 2024
  • 본 연구는 ESG 등급이 제공되지 않는 국내 공공기관의 ESG 등급을 추정하는 비지도 학습 기반 군집모형을 제안한다. 이를 위해, 스펙트럼 군집과 k-means 군집에서 최적의 클러스터 수를 비교했고, 그 결과의 신뢰성을 보장하기 위해 성능지표인 Davies-Bouldin Index (DBI)를 계산했다. 결과적으로, 스펙트럼 군집과 k-means 군집에서 각각 0.734 및 1.715의 DBI 값을 산출했는데, 이는 값이 작을수록 우수한 성능을 의미하므로 스펙트럼 군집의 우수성을 확인하였다. 게다가, T-검정 및 ANOVA를 이용하여 ESG 비재무 데이터 간 통계적으로 유의미한 차이를 밝혀내고, 상관계수를 이용하여 ESG 항목 간 상관관계를 확인했다. 본 연구는 이러한 결과를 바탕으로 기존 ESG 등급 없이 공공기관별 ESG 성과 순위를 추정할 가능성을 제시한다. 이는 최적의 클러스터 수를 계산한 다음, 각 클러스터 내 ESG 데이터의 평균 총합을 결정함으로써 달성된다. 따라서, 제안된 모델은 다양한 국내 공공기관의 ESG 등급을 평가하는 근거로 활용될 수 있고, 국내 지속가능경영 실천과 성과관리에 유용할 것으로 기대된다.

통합된 비디오 인덱싱 방법을 이용한 내용기반 비디오 데이타베이스의 설계 및 구현 (Design and Implementation of Content-based Video Database using an Integrated Video Indexing Method)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.661-683
    • /
    • 2001
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이타베이스에 대한 효율적인 관리는 더욱 중요한 의미를 가지게 되었다. 그리고 초고속 정보통신망과 디지털 기술의 발전은 비디오 데이타를 통신 및 컴퓨터와 결합하여 새로운 멀티미디어로 발전하고 있으며, 인터넷 방송, 주문형 비디오(VOD) 등에 크게 활용하고 있다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 비디오를 검색하기 위해 비디오의 정확한 특징정보를 추출하여 비디어 데이타베이스를 구축하여야 한다. 비디오 데이타베이스는 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 비디오 데이타베이스에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 비디오 데이타베이스 생성기법과 효율적인 검색기법이 필요하다. 본 논문에서는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적할 수 있는 내용기반 비디오 데이타베이스의 구축 방안과 생성기법을 제시하였다. 그리고 제안된 비디오 데이타베이스의 구축 방안과 생성기법을 사용하여 새로운 인터넷 방송 프로그램 컨텐츠 제작에 활용할 수 있는 비디오 데이타베이스를 구현하였다. 이를 위해 비디오 분할과 대표키 프레임 추출 시 비디오의 의미적 구조와 사전 제작지식정보의 상호관계를 기반으로 하여 비디오 데이타의 특징정보를 추출하고, 검색할 수 있도록 주석기반 검색과 내용기반 검색을 통합한 비디오 인덱싱 방법을 제시하였다. 통합된 비디오 인덱싱 방법은 비디오의 하위 레벨에 표현된 내용기반 메타데이타 유형과 비디오의 특징정보 추출이 어려운 상위 레벨에 표현된 주석기반 메타데이타 유형을 동시에 이용하므로 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 비디오 데이타베이스는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적하여 데이타베이스를 구축하므로 정확한 인터넷 방송 컨텐츠 정보의 축적관리와 구축작업의 효율화가 가능하며, 또한 인터넷 방송 컨텐츠 제작 시 정보공유 및 재이용이 가능하므로 새로운 컨텐츠 제작의 효율성을 높일 수 있다.

  • PDF

Sentiment Analysis of Product Reviews to Identify Deceptive Rating Information in Social Media: A SentiDeceptive Approach

  • Marwat, M. Irfan;Khan, Javed Ali;Alshehri, Dr. Mohammad Dahman;Ali, Muhammad Asghar;Hizbullah;Ali, Haider;Assam, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.830-860
    • /
    • 2022
  • [Introduction] Nowadays, many companies are shifting their businesses online due to the growing trend among customers to buy and shop online, as people prefer online purchasing products. [Problem] Users share a vast amount of information about products, making it difficult and challenging for the end-users to make certain decisions. [Motivation] Therefore, we need a mechanism to automatically analyze end-user opinions, thoughts, or feelings in the social media platform about the products that might be useful for the customers to make or change their decisions about buying or purchasing specific products. [Proposed Solution] For this purpose, we proposed an automated SentiDecpective approach, which classifies end-user reviews into negative, positive, and neutral sentiments and identifies deceptive crowd-users rating information in the social media platform to help the user in decision-making. [Methodology] For this purpose, we first collected 11781 end-users comments from the Amazon store and Flipkart web application covering distant products, such as watches, mobile, shoes, clothes, and perfumes. Next, we develop a coding guideline used as a base for the comments annotation process. We then applied the content analysis approach and existing VADER library to annotate the end-user comments in the data set with the identified codes, which results in a labelled data set used as an input to the machine learning classifiers. Finally, we applied the sentiment analysis approach to identify the end-users opinions and overcome the deceptive rating information in the social media platforms by first preprocessing the input data to remove the irrelevant (stop words, special characters, etc.) data from the dataset, employing two standard resampling approaches to balance the data set, i-e, oversampling, and under-sampling, extract different features (TF-IDF and BOW) from the textual data in the data set and then train & test the machine learning algorithms by applying a standard cross-validation approach (KFold and Shuffle Split). [Results/Outcomes] Furthermore, to support our research study, we developed an automated tool that automatically analyzes each customer feedback and displays the collective sentiments of customers about a specific product with the help of a graph, which helps customers to make certain decisions. In a nutshell, our proposed sentiments approach produces good results when identifying the customer sentiments from the online user feedbacks, i-e, obtained an average 94.01% precision, 93.69% recall, and 93.81% F-measure value for classifying positive sentiments.

스마트 TV 환경에서 정보 검색을 위한 사용자 프로파일 기반 필터링 방법 (A User Profile-based Filtering Method for Information Search in Smart TV Environment)

  • 신위살;오경진;조근식
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.97-117
    • /
    • 2012
  • 인터넷 사용자는 비디오를 보면서 소셜 네트워크 서비스를 이용하고 웹 검색을 하고, 비디오에 나타난 상품에 관심이 있을 경우 검색엔진을 통해 정보를 찾는다. 비디오와 사용자의 직접적인 상호작용을 위해 비디오 어노테이션에 대한 연구가 진행되었고, 스마트 TV 환경에서 어노테이션 된 비디오가 활용될 경우 사용자는 객체에 대한 링크를 통해 원하는 상품의 정보를 쉽게 확인할 수 있게 된다. 사용자가 상품에 대한 구매를 원할 경우 상품에 대한 정보검색 이외에 상품평이나 소셜 네트워크 친구의 의견을 통해 구매 결정을 한다. 소셜 네트워크로부터 발생되는 정보는 다른 정보에 비해 신뢰도가 높아 구매 결정에 큰 영향을 미친다. 하지만 현재 소셜 네트워크 서비스는 의견을 얻고자 할 경우 모든 소셜 네트워크 친구들에게 전달되고 많은 의견을 얻게 되어 이들로부터 유용한 정보를 파악하는 것은 쉽지 않다. 본 논문에서는 소셜 네트워크 사용자의 프로파일을 기반으로 상품에 대해 유용한 정보를 제공할 수 있는 친구를 규명하기 위한 필터링 방법을 제안한다. 사용자 프로파일은 페이스북의 사용자 정보와 페이스북 페이지의 'Like' 정보를 이용하여 구성된다. 프로파일의 상품 정보는 GoodRelations 온톨로지와 BestBuy 데이터를 이용하여 의미적으로 표현된다. 사용자가 비디오를 보면서 상품 정보를 얻고자 할 경우 어노테이션된 URI를 이용하여 정보가 전달된다. 시스템은 소셜 네트워크 친구들에 대한 사용자 프로파일과 BestBuy를 기반으로 어노테이션된 상품에 대한 의미적 유사도를 계산하고 유사도 값에 따라 순위가 결정한다. 결정된 순위는 유용한 정보를 제공할 수 있는 소셜 네트워크 상의 친구를 규명하는데 사용된다. 참가자의 동의하에 페이스북 정보를 활용하였고, 시스템에 의해 도출된 결과와 참가자 인터뷰를 통해 평가된 결과를 이용하여 타당성을 검증하였다. 비교 실험의 결과는 제안하는 시스템이 상품 구매결정을 하기 위해 유용한 정보를 획득할 수 있는 방법임을 증명한다.

정적 오염 분석을 활용한 타입스크립트 코드의 보안 취약점 탐지 (Detecting Security Vulnerabilities in TypeScript Code with Static Taint Analysis)

  • 문태근;김형식
    • 정보보호학회논문지
    • /
    • 제31권2호
    • /
    • pp.263-277
    • /
    • 2021
  • 자바스크립트로 작성된 웹 어플리케이션에서 Cross-Site Scripting (XSS), SQL Injection과 같은 검증되지 않은 사용자 입력 데이터로 인해 발생하는 취약점을 탐지하기 위해 오염 분석 기법이 널리 사용되고 있다. 이러한 취약점을 탐지하기 위해서는 사용자 입력 데이터에 영향을 받는 변수들을 추적하는 것이 중요하지만, 자바스크립트의 동적인 특성으로 인해 웹 어플리케이션을 실행해 보지 않고 그러한 변수들을 식별하는 것은 매우 어렵다. 때문에, 기존의 오염 분석 도구들은 대상 어플리케이션을 실행하는 오버헤드가 존재하는 동적 오염 분석을 사용하도록 개발되었다. 본 논문에서는 타입스크립트(자바스크립트의 상위집합) 컴파일러를 활용해 얻은 심볼 정보를 기반으로 데이터의 흐름을 정확히 추적하고, 타입스크립트 코드에서 보안 취약점을 발견하는 새로운 정적 오염 분석 기법을 제안하였다. 제안한 기법은 개발자가 검증되지 않은 사용자 입력 데이터를 포함할 수 있는 변수에 표시를 할 수 있도록 하며, 이를 활용해 사용자 입력 값에 영향을 받는 변수와 데이터를 추적한다. 제안한 기법은 TypeScript 컴파일러에 원활히 통합될 수 있기 때문에, 별도의 도구로 작동하는 기존 분석 도구와 달리 개발자가 개발 과정에서 취약점을 발견할 수 있게 한다. 제안한 기법의 유효성을 확인하기 위해 프로토타입을 구현하였으며, 취약점이 보고된 8개의 웹 어플리케이션을 선정하여 분석을 수행하여 성능을 평가한 결과 기존의 취약점을 모두 탐지할 수 있음을 확인하였다.

KOMPSAT-3/3A 영상으로부터 U-Net을 이용한 산업단지와 채석장 분류 (Classification of Industrial Parks and Quarries Using U-Net from KOMPSAT-3/3A Imagery)

  • 박채원;정형섭;이원진;이광재;오관영;장재영;이명진
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1679-1692
    • /
    • 2023
  • 대한민국은 인구 증가와 산업 발전의 결과로 많은 양의 오염물질을 배출하는 국가이자, 지리적 위치로 인해 월경성 대기오염의 심각한 영향을 받는 국가이다. 국내외에서 발생하는 오염물질이 대한민국의 대기오염에 큰 피해를 야기하는 상황에서, 대기 오염물질 배출원의 위치 정보는 대기 중 오염물질의 이동 및 분포를 파악하고, 국가 차원의 대기오염 관리 및 대응 전략을 수립하는 데 매우 중요하다. 본 연구는 이러한 배경을 바탕으로, 고해상도 광학위성 영상과 딥러닝 기반의 영상 분할 모델을 활용하여 대기오염 현황을 분석하는 데 필수적인 국내외 대기오염물질 배출원의 공간 정보를 효과적으로 획득하는 것을 목표로 수행되었다. 특히, 월경성 대기오염에 크게 기여하는 것으로 평가된 산업단지와 채석장을 주요 연구 대상으로 선정하였으며, 이들 영역에 대한 다목적실용위성 3호 및 3A호의 영상들을 수집하여 전처리한 후, 모델 학습을 위한 입력 및 라벨 데이터로 변환하였다. 해당 데이터를 활용하여 U-Net 모델을 학습시킨 결과, 전체 정확도는 0.8484, mean Intersection over Union (mIoU)은 0.6490을 달성하였다. 모델의 예측 결과 맵은 코스 어노테이션(Course Annotation) 방식으로 제작된 라벨 데이터보다 객체의 경계를 더욱 정확하게 추출하는 것으로 나타나, 데이터 처리 및 모델 학습 방법론의 유효성을 입증하였다.

Annotation and Expression Profile Analysis of cDNAs from the Antarctic Diatom Chaetoceros neogracile

  • Jung, Gyeong-Seo;Lee, Choul-Gyun;Kang, Sung-Ho;Jin, Eon-Seon
    • Journal of Microbiology and Biotechnology
    • /
    • 제17권8호
    • /
    • pp.1330-1337
    • /
    • 2007
  • To better understand the gene expression of the cold-adapted polar diatom, we conducted a survey of the Chaetoceros neogracile transcriptome by cDNA sequencing and expression of interested cDNAs from the Antarctic diatom. A non-normalized cDNA library was constructed from the C. neogracile, and a total of 2,500 cDNAs were sequenced to generate 1,881 high-quality expressed sequence tags (ESTs) (accession numbers EL620615-EL622495). Based on their clustering, we identified 154 unique clusters comprising 342 ESTs. The remaining 1,540 ESTs did not cluster. The number of unique genes identified in the data set is thus estimated to be 1,694. Taking advantage of various tools and databases, putative functions were assigned to 939 (55.4%) of these genes. Of the remaining 540 (31.9%) unknown sequences, 215 (12.7%) appeared to be C. neogracile-specific since they lacked any significant sequence similarity to any sequence available in the public databases. C. neogracile consisted of a relatively high percentage of genes involved in metabolism, genetic information processing, cellular processes, defense or stress resistance, photosynthesis, structure, and signal transduction. From the ESTs, the expression of these putative C. neogracile genes was investigated: fucoxanthin chlorophyll (chl) a,c-binding protein (FCP), ascorbate peroxidase (ASP), and heat-shock protein 90 (HSP90). The abundance of ASP and HSP90 changed substantially in response to different culture conditions, indicating the possible regulation of these genes in C. neogracile.

비디오의 의미검색과 예제기반 장면검색을 위한 비디오 검색시스템 (Video Retrieval System supporting Content-based Retrieval and Scene-Query-By-Example Retrieval)

  • 윤미희;조동욱
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.105-112
    • /
    • 2002
  • 비디오데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미검색기법이 요구된다. 본 논문에서는 특징 기반 검색과 주석 기반 검색을 통합하여 다양한 사용자의 의미검색을 지원하고, 유사성 질의와, SQBE(scene query by example) 질의가 가능한 비디오 검색시스템(Video Retrieval System : VRS)을 제안한다. 사용자는 SQBE 질의를 통해 장면의 검색 결과로 제시된 장면을 기반으로 객체의 추가 삭제를 통해 사용자가 원하는 좀 더 정확한 장면의 검색이 가능하다. 또한 SQBE질의를 위한 질의언어와 이 질의를 처리하기 위한 질의처리알고리즘을 제안하고 장면과 객체의 유사성 검색에 대한 성능평가를 수행했다. 제안된 시스템은 Visual C++과 Oracle을 이용하여 구현되었다.