• 제목/요약/키워드: 데이터 조직

검색결과 1,139건 처리시간 0.025초

전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류 (Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method)

  • 유시호;조성배
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.83-92
    • /
    • 2004
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 마이크로어레이상에서 측정한 것으로, 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에 유전 발현 데이터를 통하여 암을 분류할 수 있다. 그러나 분류에 모든 유전자가 관여하지는 않으므로 효율적인 암의 분류를 위해서는 관련성 있는 소수의 유전자만을 선별해내는 작업인 특징선택 방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선하고 분류하는 방법을 제안한다. 이 방법은 선택되는 유전자들의 중복된 정보를 최소화시켜 암의 분류에 있어 보다 효과적인 유전자 선택을 한다. 실험데이터는 대장암 데이터(Colon cancer dataset)를 사용하였고, 분류기는 k-최근접 이웃(KNN)을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징선택 방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다. 추가적으로 림프종 데이터에 대한 실험을 하였고, 그 결과 전진 선택법의 유용성을 확인할 수 있었다.

유전자 발현 데이터 기반 구강암에서의 세포 조성 차이 분석 (Distinct cell subtype composition using gene expression data in oral cancer)

  • 이제근
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.59-65
    • /
    • 2019
  • 암 조직에는 다양한 형태의 세포가 존재하지만, 이들의 조성을 실험적으로 확인하기는 매우 어렵다. 본 연구에서는 유전자 발현 데이터에 통계적 기계학습 모델을 적용하여 각 샘플의 세포 조성을 추론하고, 이러한 세포 조성이 암조직과 정상 조직간에 차이가 있는지를 확인하였다. 두 가지 서로 다른 회귀 모델을 이용하여 세포 조성을 예측한 결과 CD8 T cell과 Neutrophil이 구강암 조직에서 정상 조직에 비해 증가함을 확인할 수 있었다. 또한 비지도학습 중 하나인 t-SNE를 적용하여, 유추된 세포 조성에 의해 정상 조직과 구강암 조직이 서로 군집을 이루고 있음을 확인하였고, 지도 학습 기반의 다양한 분류 알고리즘들을 이용하여 세포 조성 정보를 이용하여 구강암과 정상 조직을 예측하는 것이 가능함을 보였다. 이 연구는 구강암의 면역 세포 침투에 대한 이해도를 증진하는데에 도움을 줄 수 있을 것이다.

microRNA 발현 데이터의 상관관계 분석을 통한 microRNA Functional Family 탐색 (Defining microRNA functional families through correlation analysis of microRNA microarray data)

  • 남진우;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.13-15
    • /
    • 2006
  • microRNA는 유전자의 전사 후 과정에서 negative regulation을 담당하는 small noncoding RNA의 한 증류이다. 최근까지 330여개의 인간 microRNA가 발견되었지만 그들의 기능이 밝혀진 것은 소수에 불과하다. microRNA의 기능은 3'UTR에 불완전 상보결합을 통해 negative regulation을 받게 되는 유전자의 기능으로부터 유추되는 것이 일반적이다. 특별히 유전체상에 군집화 된 microRNA들은 하나의 전사체로부터 발현되는 것으로 판단되며, 같은 또는 관련된 기능을 하거나 같은 목표 유전자를 조절하기 위한 functional family일 가능성이 높다. 또한 이러한 functional family는 하나의 전사체로부터 발현되기 때문에, 조직별로 조건별로 같은 발현 패턴을 보여야 한다. 본 연구에서는 발현데이터로부터 microRNA functional family를 탐색하기 위해, 5개의 연구 그룹에서 공개한 조직별 microRNA 발현데이터를 표준화 작업을 거친 후 통합하고 k-nearest neighbor 알고리즘을 이용해 결측치를 보정한 후 microRNA 발현사이의 correlation을 계산한다. 이때 데이터 통합에서 생기는 문제에 robust한 결과를 얻기 위해 실제 발현데이터가 아닌 rank 데이터부터 correlation을 측정한다. 계산된 spearman ranked correlation 결과와 microRNA의 genomic coordination 정보로부터 34개의 functional family를 정의할 수 있었다.

  • PDF

농업벤처기업의 빅데이터 활용의도에 영향을 미치는 기술·조직·환경 관점의 핵심요인 연구: 기술분야의 조절효과를 중심으로 (A Study on the Key Factors Affecting Big Data Use Intention of Agriculture Ventures in Terms of Technology, Organization and Environment: Focusing on Moderating Effect of Technical Field)

  • 안문형
    • 벤처창업연구
    • /
    • 제16권6호
    • /
    • pp.249-267
    • /
    • 2021
  • 디지털화의 진전과 함께 축적된 빅데이터의 활용은 글로벌 농산업계에 파괴적 혁신을 가져오고 있다. 최근 정부는 농업 빅데이터 플랫폼 구축 및 지원조직 신설 등의 조치를 취하고 있으나 국내 농산업계는 재배생육 분야의 일부기업 외에는 빅데이터 활용이 미흡한 실정이다. 이러한 배경에서 본 연구는 빅데이터를 선도적으로 활용하여 혁신을 창출하는 주체가 되어야 할 농업벤처를 중심으로 기술, 조직, 환경의 맥락에서 빅데이터 활용의도에 영향을 미치는 요인을 규명하고 기술분야에 따른 조절효과를 확인하고자 하였다. 이에 농업기술실용화재단 A+센터의 지원을 받는 농업벤처 309개로부터 연구 데이터를 확보하여 SPSS 22.0을 이용하여 분석하였다. 연구결과, 기술적 요인 중에서는 상대적 이점과 호환성이 유의한 정(+)의 영향을 미치고, 조직적 요인 중에서는 경영층 지원이 정(+)의 영향을, 비용이 부(-)의 영향을 미치며, 환경적 요인 중에서는 정책적 지원이 정(+)의 영향을 미치는 것으로 나타났다. 기술분야의 조절효과 검증 결과, 재배생육 외 기업일수록 상대적 이점, 호환성, 경쟁자 압력 외의 모든 변수와 빅데이터 활용의도와의 관계를 완화하는 조절효과가 있는 것으로 나타났다. 이러한 결과를 통해 다음과 같은 시사점을 제시하였다. 첫째, 빅데이터 활용을 통해 농업벤처에 새로운 수익창출 및 운영효율성 제고 기회를 제공할 핵심사업을 선정하여 정책적으로 협업기회를 늘릴 필요가 있다. 둘째, 농산업 특성으로 인한 분석의 어려움을 극복할 수 있는 빅데이터 분석 솔루션 제공이 필요하다. 셋째, 농업벤처와 같은 소규모 조직에서는 최고경영층의 빅데이터 활용에 대한 높은 이해수준으로부터 출발한 조직문화 재편 의지가 선행되어야 한다. 넷째, 중소·벤처기업 수준에서 벤치마킹할 수 있는 성공사례를 발굴하고 홍보하는 것이 중요하다. 다섯째, 농업벤처 기술분야별로 핵심사업 추진과 지원사업의 우선순위를 나누어 추진하는 것이 보다 효과적일 것으로 판단된다. 마지막으로 본 연구의 한계점과 후속 연구과제를 제시하였다.

인체분절계수 추정을 위한 CT 영상기반 3D 분석도구 개발에 관한 연구 (A Study on Development of 3D Analysis Tool for Estimation of Body Segment Parameter)

  • 박성빈;정경렬;최준호;김사엽
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.325-326
    • /
    • 2011
  • 인체의 질량분포, 부피, 무게중심 등은 운동역학적 변인들을 분석하기위한 중요한 파라미터로 활용된다. 본 연구는 이러한 파라미터, 즉 인체분절계수를 추정하기 위한 분석도구의 개발에 관한 연구이다. 분석은 CT촬영을 통해 얻어진 2차원 의료영상데이터에 대해, 영상정보를 읽어 watershed 알고리즘을 통해 체성분에 따라 지방조직, 뼈조직, 근육조직에 따른 영역경계를 반 자동으로 구분할 수 있다. 분절계수의 추정은 최종적으로 확보한 영상에 대해, 분절경계면을 구분하여 이에 따른 질량, 부피 및 무게중심에 대한 비율을 계산하고 결과는 CSV 타입으로 저장한다. 개발된 분석도구는 연구목적에 따라 다양하게 분절화가 가능할 뿐만 아니라 영상데이터의 확보를 통해 인체분절계수 데이터베이스의 확장 구축에 기여할 수 있다.

  • PDF

PLM과 ERP 통합

  • 박정현
    • 한국CDE학회지
    • /
    • 제13권1호
    • /
    • pp.14-19
    • /
    • 2007
  • PLM과 ERP의 정보 및 프로세스 통합은 개개의 기여도 함보다는 훨씬 큰 종합적인 이익을 가져오기 위하여 조직 전반에 걸쳐서 사용자들의 생산성을 제고한다. 그러나 이러한 이익을 얻기 위하여 정보는 조직을 통하여 자유로운 흐름이 있어야 한다. 이러한 통합의 범위를 결정하는 것은 복잡한 작업이 될 수 있다. 반드시 고려되어야 할 인자로는 다음과 같다. - 데이터 및 포로세스 소유권 - 정보의 마스터 출처 정의 - 필요한 통합 수준 - 제품 설계 및 생산의 두 영역에 걸쳐있는 프로세스를 어떻게 관리할 것인가? - 공통된 용어를 사용 각 회사에서 PLM과 ERP를 통합하는 최상의 방법을 결정할 때, 필요로 하는 것에 우선권을 두어야 한다. 즉, 희망하는 것 보다는 비즈니스상 요구되는 사항에 대한 것이다. 개발, 초기적용, 진행중인 유지보수를 포함하여 소유총비용(total cost of ownership)을 계산한다. PLM-ERP 통합은 데이터 통합 그 이상의 작업임을 명심하여야 한다. 이익을 최대화하기 위하여 제품과 관련된 정보, 프로세스. 조직 및 구성원의 광범위한 범위를 포함하여야 한다. 기업의 진취적인 노력에도 불구하구, 경영진의 지원은 성공에 결정적이다. 고심하고 있는 경영진이나 문제들을 인정하고 있는 사람들은 제품개발 프로세스 내에서 PLM과 ERP 통합의 필요성, 솔루션 및 이익에 대하여 필요한 교육을 제공받는 것을 필요로 하고 있다. 더욱이 그들은 성공을 보장하는 통합, 지침제공, 후원 및 자원의 사전 행동하는 지지자가 되기를 희망한다.

  • PDF

공공데이터 품질관리를 위한 조직 성숙도 평가 모델 (An Organizational Maturity Assessment Model for Public Data Quality Management)

  • 김선호;이창수;정승호;김학철;이창수
    • 정보화정책
    • /
    • 제22권1호
    • /
    • pp.28-46
    • /
    • 2015
  • 정부 3.0의 확산으로 공공 데이터의 활용요구가 증대되고 있으나, 정부가 보유하고 있는 공공데이터의 품질 및 관리체계는 아직 성숙화되어 있지 않아 데이터 개방 및 활용의 저해 요소로 부각되고 있다. 데이터 관리 및 연계 활용의 효과와 효율성을 향상시키기 위해서는 데이터 품질관리에 관한 표준 마련과 이를 평가할 수 있는 평가기준의 마련이 필요하며, 지속적인 품질관리가 이루어질 수 있도록 수준을 측정할 수 있는 체계의 마련이 필요하다. 본 연구는 공공데이터 품질관리 수준을 평가하고, 품질관리 수준을 지속적으로 판단할 수 있는 데이터 품질관리 성숙도 모델을 제시한다. 성숙도 모델은 프로세스 참조 모델과 측정 프레임워크로 구성하였다. 프로세스 참조 모델은 PDCA 기반의 15개 프로세스를 정립하였으며 이를 토대로 프로세스의 능력 수준과 데이터 품질관리 조직의 성숙도 수준을 평가하는 프레임워크를 마련하였다. 본 연구에서 제시한 성숙도 모델은 향후 공공기관이 보유하고 있는 데이터의 품질관리 현 수준을 진단하고 문제점을 개선하는 등 보유 공공데이터의 지속적인 품질향상을 위한 단계별 목표와 방향성을 수립하는 데 활용할 수 있으며, 궁극적으로는 공공데이터의 품질 신뢰도 향상을 통한 안정적인 공공데이터의 민간 개방을 촉진하고 이용을 활성화하는 데 적극 기여할 것으로 판단된다.

Metadata Registry를 적용한 분산된 국내 문헌정보 DB의 연계 활용 모형 구축에 관한 연구 (A study on constructing a database in liaison with the distributed bibliographic data using the Metadata Registry)

  • 박정훈;이응봉
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.389-395
    • /
    • 2003
  • 현재, 다수의 조직에서 개별적으로 메타데이터 표준을 제시하고 구축하고 있다. 이로 인해 메타데이터 상호간 호환성의 문제가 발생하게 되고 각기 분산되어 구축된 메타데이터 이용 또한 원활하지 않게 되고 있다. 이를 해결하기 위해 본고에서는 메타데이터 레지스트리를 적용하여 국내 문헌정보 DB의 메타데이터 표준 유지와 통합 검색을 통한 연계 활용 모형을 구축하고자 한다.

  • PDF

종합병원 직원들의 조직지원인식이 직무태도에 미치는 영향 (The Effect of Perceived Organization Support on Hospital Employees' Attitude)

  • 안상윤
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.1115-1125
    • /
    • 2010
  • 본 논문은 우리나라 종합병원에 근무하는 직원들의 조직지원인식이 직무태도 변수인 조직신뢰, 상사신뢰, 조직몰입 및 고객지향성에 미치는 영향을 분석하고, 인사관리에 영향을 미치는 중요한 인구통계학적 변수인 성별, 직종별, 고용형태별 특성에 따른 독립변수와 종속변수의 지각의 차이를 검증했다. 분석을 위한 데이터는 전국 9개 종합병원에 근무하는 277명의 직원들을 대상으로 한 설문조사를 통해 수집되었다. 분석결과 병원 직원들의 조직지원인식은 조직 및 상사 신뢰, 조직몰입, 고객지향성에 유의하게 영향을 미치는 것으로 나타났다. 또한 인구통계적 변수에 따른 차이 검증에서도 비정규직 직원들은 조직지원인식, 조직 및 상사 신뢰, 조직몰입, 고객지향성을 낮게 지각하는 것으로 나타났다. 여성 직원들은 남성 직원들에 비하여 조직 및 상사 지원인식도와 조직몰입도가 낮은 것으로 분석되었다.

CRM에서의 DW 활용방안

  • 장중호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.106-112
    • /
    • 2001
  • o CRM이란 기업이 모든 기업 활동을 고객 지향적으로 관리하기 위한 전략적, 프로세스, 조직적, 기술적 변화 과정 자체를 의미함. 기업은 고객과 관련한 지식을 획득하여 각 조직으로 확산시키고, 다양한 방법으로 고객과 만나면서 그러한 정보를 활용하게 되며, 그 결과 기업의 매출이 증대되고 기업이 효율적으로 활동하게 됨(Gartner Group) (중략)

  • PDF