• 제목/요약/키워드: Data Scientists

검색결과 3,357건 처리시간 0.027초

A Survey of Transfer and Multitask Learning in Bioinformatics

  • Xu, Qian;Yang, Qiang
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.257-268
    • /
    • 2011
  • Machine learning and data mining have found many applications in biological domains, where we look to build predictive models based on labeled training data. However, in practice, high quality labeled data is scarce, and to label new data incurs high costs. Transfer and multitask learning offer an attractive alternative, by allowing useful knowledge to be extracted and transferred from data in auxiliary domains helps counter the lack of data problem in the target domain. In this article, we survey recent advances in transfer and multitask learning for bioinformatics applications. In particular, we survey several key bioinformatics application areas, including sequence classification, gene expression data analysis, biological network reconstruction and biomedical applications.

Applying Formal Methods to Modeling and Analysis of Real-time Data Streams

  • Kapitanova, Krasimira;Wei, Yuan;Kang, Woo-Chul;Son, Sang-H.
    • Journal of Computing Science and Engineering
    • /
    • 제5권1호
    • /
    • pp.85-110
    • /
    • 2011
  • Achieving situation awareness is especially challenging for real-time data stream applications because they i) operate on continuous unbounded streams of data, and ii) have inherent realtime requirements. In this paper we showed how formal data stream modeling and analysis can be used to better understand stream behavior, evaluate query costs, and improve application performance. We used MEDAL, a formal specification language based on Petri nets, to model the data stream queries and the quality-of-service management mechanisms of RT-STREAM, a prototype system for data stream management. MEDAL's ability to combine query logic and data admission control in one model allows us to design a single comprehensive model of the system. This model can be used to perform a large set of analyses to help improve the application's performance and quality of service.

상대 지지도를 이용한 의미 있는 희소 항목에 대한 연관 규칙 탐사 기법 (Mining Association Rules on Significant Rare Data using Relative Support)

  • 하단심;황부현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.577-586
    • /
    • 2001
  • 최근의 데이타베이스 연구 분야에서는 대규모의 데이타베이스에 저장된 데이타를 분석하여 데이타베이스에 존재하지만 쉽게 드러나지 않는 암시적인 지식을 탐사하는 기술인 데이타마이닝이 각광받 고 있다. 본 논문에서는 이러한 데이타 마이닝의 기법 중의 하나인 연관 규칙 탐사 기법온 연구하며 비록 데이타베이스에서 희소하게 나타나는 데이타이지만 임의의 데이타와 높온 비율로 동시에 나타나는 의미 있는 희소 데이타를 고려한 연관 규칙 탐사 기법을 제안한다. 또한 이러한 희소 항목의 탐사에 대하여 기 존의 연판 규칙 탐사 알고리즘과 제안한 알고리즘의 성능을 비교하여 평가한다.

  • PDF

The Effect of Gender Composition of Research Teams on Individual Researchers' Performance in China

  • Ma, Ying
    • STI Policy Review
    • /
    • 제8권2호
    • /
    • pp.1-22
    • /
    • 2017
  • This article explores the relationship between the gender composition of scientific research teams and scientists' individual performance. The gender composition of research teams is an important feature of workplace settings and influences the way people interact and communicate; however, previous research has not directly examined its relationship with scientists' individual performance. Drawing on data collected on university faculties in China in 2016, this article tests several hypotheses about individual's performance in teams with different gender compositions. The results show that team gender composition has a clear gendered effect on scientists' individual performance. The effects of tokenism for women in men-majority teams is proven, but men in women-majority teams appear to be unaffected by tokenism. Moreover, the theories claiming that homogenous teams are more conducive to better individual performance than mixed teams are supported for men but not for women. The findings of this research suggest that recruiting more women into the scientific workforce may improve their performance and thereby help diminish the gender gap in performance. It also indicates that the Chinese preferential policies towards women in science formulated in recent years have had positive impacts. However, considering that more than half of the researchers in the survey are working in men-majority teams, the task of narrowing the gender gap in performance remains a challenge. Further work is needed to explore the tensions and benefits of working with the opposite gender.

트위터 데이터를 이용한 연구자들의 비공식 커뮤니케이션 활동 및 대중이용 내용분석: 국내 사회과학 분야 연구자들을 중심으로 (Content Analysis on Twitter for Identifying Scholarly Activities and Public Use in Informal Communication: With a Focus on Domestic Scholars in Social Sciences)

  • 심지영;송성전
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.133-152
    • /
    • 2019
  • 본 연구는 사회과학 연구자의 비공식 커뮤니케이션 활동 및 대중이용 패턴을 파악하고 범주화하는 데 초점을 맞춘다. 트위터 데이터를 이용하여 대중과의 커뮤니케이션 활동에 참여한 국내 사회과학 연구자 736명을 식별하고, 이 연구자들의 비공식 커뮤니케이션 활동이 드러난 트윗 4,548개를 내용분석하였다. 본 연구는 지금까지 학술커뮤니케이션 연구에서 밝혀지지 않았던 사회과학자와 일반대중 간의 비공식적인 커뮤니케이션을 탐색하고, 구체적인 비공식 커뮤니케이션 활동 내용, 커뮤니케이션 매체 및 협업 분야의 유형을 식별했다는 점에서 의미가 있다.

화장품원료 온라인 데이터베이스 구축과 활용 (The practical use with online database program of cosmetics' raw materials.)

  • 전상훈;김주덕
    • 대한화장품학회지
    • /
    • 제29권2호
    • /
    • pp.233-250
    • /
    • 2003
  • 현재 화장품 연구업무 및 수출입업무 종사자들이 많이 사용하고 있는 ICID 및 장원기 등의 화장품 원료규격집과 각종 원료메이커들이 제공하는 원료의 기술자료, MSDS 등의 기술문서를 연관 데이터베이스로 처리하여 인터넷 서버&클라이언트의 구조를 통해 사용자들에게 제공되어질 수 있는 온라인형 데이터베이스 프로그램을 개발하였고, 이를 완성한 도구로서 서버로는 Linux Machine을 사용하였고, 데이터베이스서버로는 MySQL Server를, CGI Tool로는 PHP를 사용하였다. 또한 데이터베이스 구조상 차후 확장성을 대비하여 데이터베이스를 연관구조로 작성하였으며, 이는 데이터의 중복성을 피하여 화장품 원료정보의 검색 효율을 높일 수 있었고, 차후 다른 화장품관련데이터베이스와의 상호 연계의 인터페이스를 마련할 수 있었다. 데이터베이스의 특성상 한번 구축되면 원하는 형태로의 자료변환 및 재구성이 용이하여, 아직까지 화장품 원료 데이터베이스가 구축되어 있지 못한 국내현실을 볼 때 본 프로그램이 화장품업계의 소중한 기초자료로 활용되기를 기대한다.

인터넷 EDI(Electronic Data Interchange (Design and implementation Internet EDI)

  • 이진용;권혁인;김영찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.427-429
    • /
    • 1998
  • VAN EDI의 단점인 폐쇄성과 비용을 극복하기 위해서 제안된 인터넷 EDI를 구현한다. 인터넷 EDI의 구현 방법인 인터넷 메일 기반 EDI와 웹 기반 EDI의 장점을 통합하여 웹에서의 통합적인 기업간의 전자상거래 솔루션을 지원하기 위한 웹에서의 인터넷 메일기반 EDI를 설계하고 구현하고 보안 요소를 추가한다.

  • PDF