• 제목/요약/키워드: 웹 분할

검색결과 212건 처리시간 0.029초

Web access prediction based on parallel deep learning

  • Togtokh, Gantur;Kim, Kyung-Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.51-59
    • /
    • 2019
  • 웹에서 정보 접근에 대한 폭발적인 주문으로 웹 사용자의 다음 접근 페이지를 예측하는 필요성이 대두되었다. 웹 접근 예측을 위해 마코브(markov) 모델, 딥 신경망, 벡터 머신, 퍼지 추론 모델 등 많은 모델이 제안되었다. 신경망 모델에 기반한 딥러닝 기법에서 대규모 웹 사용 데이터에 대한 학습 시간이 엄청 길어진다. 이 문제를 해결하기 위하여 딥 신경망 모델에서는 학습을 여러 컴퓨터에 동시에, 즉 병렬로 학습시킨다. 본 논문에서는 먼저 스파크 클러스터에서 다층 Perceptron 모델을 학습 시킬 때 중요한 데이터 분할, shuffling, 압축, locality와 관련된 기본 파라미터들이 얼마만큼 영향을 미치는지 살펴보았다. 그 다음 웹 접근 예측을 위해 다층 Perceptron 모델을 학습 시킬 때 성능을 높이기 위하여 이들 스파크 파라미터들을 튜닝 하였다. 실험을 통하여 논문에서 제안한 스파크 파라미터 튜닝을 통한 웹 접근 예측 모델이 파라미터 튜닝을 하지 않았을 경우와 비교하여 웹 접근 예측에 대한 정확성과 성능 향상의 효과를 보였다.

임의 추출 분할 방식을 이용한 동적 문제 출제 시스템 (A System to Generate Dynamic Test Using a Random Sampling Division Method)

  • 원대희;강태호;김원진;방훈;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.592-594
    • /
    • 2001
  • 원격 교육에서 시간과 장소에 제한을 받지 않도록 하기 위해서 비슷한 난이도의 문제를 출제할 수 있는 동적 문제 출제시스템이 필요하다. 이 시스템은 웹 서버에서 문제를 임의 추출하고, 추출된 문제를 임의 정렬하여, 정렬된 문제를 출력하는 방법을 사용하였다. 이 방법은 서버의 부하를 가중시켜 실행시간을 증가시키는 문제점이 있다. 이러한 문제점을 해결하기 위해서 임의 추출 기능들을 데이터베이스 서버, 웹 서버, 클라이언트로 분할하여 실행시간을 단축시키는 시스템을 제안하고 구현하였다.

  • PDF

SLA를 지원하는 웹 서버 부하 분산 기법 (A Web Server Load Balancing Mechanism for Supporting Service Level Agreement)

  • 고현주;박기진;박미선
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권8호
    • /
    • pp.505-513
    • /
    • 2006
  • 클라이언트와 서비스 제공자간의 서비스 수준 계약인 SLA(Service Level Agreement)를 만족시키기 위해서는 클라이언트 요청을 우선순위 계층으로 구분하여, 낮은 수준의 서비스를 요청하는 클라이언트 보다는 고수준의 서비스를 요구하는 클라이언트에게 우선적으로 서비스를 제공할 수 있는 기술이 필요하다. 본 논문에서는 서비스 제공자의 웹 서버 노드를 우선 순위에 따라 정적. 동적으로 분할하는 방법 및 다중계층 (Multiclass) 에서의 승인 제어 (Admission Control) 기법을 연구하였으며, 시뮬레이션을 통해 SLA를 고려한 웹 서버 처리율 및 응답시간 성능을 분석하였다.

XML 실체뷰를 이용한 XML 질의 처리 : 경로 표현식의 분할 처리 및 결과 통합 (Processing XML Queries Using XML Materialized Views : Decomposition of a Path Expression and Result Integration)

  • 문찬호;강현철
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.621-638
    • /
    • 2003
  • 웹 상에서 XML 문서의 수요가 증가함에 따라 XML 문서를 자원으로 갖는 웹 서비스 응용들이 증가하고 있다. 이들 웹 서비스 응용에서 질의 처리 시 성능 향상을 위해 XML 데이타에 대한 뷰 메커니즘을 고려할 수 있다. XML 질의 결과를 실체뷰로 유지하고, 하부 XML 문서에 대한 원래의 질의를 관련된 실체뷰에 대한 질의로 변환하여 수행한다면 질의 응답시간을 줄일 수 있을 것이다. 실체뷰를 이용한 질의 처리의 유형으로는 $\circled1$ 실체뷰로부터 원하는 결과를 모두 얻을 수 있는 유형과 $\circled2$ 질의 결과의 일부는 실체뷰에 존재하지만 일부는 하부 XML 문서로 부터 검색해야 하는 유형이 있다. 본 논문에서는 두 번째 유형에 대하여 연구한다. 본 논문의 질의는 여러 XML 질의어들이 갖는 핵심적인 기능 중 하나인 XML 경로 표현식이다. 본 논문에서는 먼저, XML 저장소 내 하부 XML 문서들로부터 도출된 XML 실체뷰의 저장 구조를 제시 한 후, 주어진 XML 질의를 실체뷰에 대한 질의와 하부 데이타에 대한 질의로 분할하는 알고리즘과 분할 질의의 결과를 통합하는 알고리즘을 제시한다. 그리고, 성능 평가를 통하여 실체뷰를 이용한 질의 분할 처리가 성능 향상을 가져오는 조건을 구한다.

사용자 퍼스널 컬러 생성을 위한 인공지능 기반 화장품 추천 웹 서비스 개발 (Development of a Web Service for Cosmetics Recommendation based on an Artificial Intelligence for User Personal Color Generation)

  • 황석형;임민택;황훈태;이승준;김수환;황세웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.461-463
    • /
    • 2023
  • MZ세대를 중심으로 자기관리를 열심히 하는 사람들이 증가함에 따라 화장의 기본이 되는 개인 피부톤(퍼스널 컬러)을 찾는 것이 중요시되고 있다. 현재 대다수 사람은 자신에게 어울리는 퍼스널 컬러를 찾기 위해 높은 비용을 지불하여 전문가를 이용하거나 객관적이고 정량화된 기준 없이 오랜 시간을 투자하여 스스로 퍼스널 컬러를 찾는 등 시간과 비용 측면에서의 한계점을 가지고 있다. 본 논문에서는 이를 보완하기 위해 이미지 기반 인공지능 기술(객체 탐지, 객체 분할, BeautyGAN)을 적용하여 데이터 기반의 정량적인 기준을 생성하고, 퍼스널 컬러에 알맞은 화장품 추천 웹 서비스를 제안한다.

  • PDF

KICT 수문레이더 모바일 표출시스템 (Mobile System of X-Band KICT-Hydrological Radar)

  • 한명선;이동률
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.520-520
    • /
    • 2015
  • 본 연구는 현재 한국건설기술연구원에서 운영중인 수문레이더의 관측자료를 사용자가 쉽게 파악할수 있도록 모바일 정보제공 시스템을 구축하는데 있다. 모바일 앱 개발 방식은 대체적으로 모바일 웹, 하이브리드 앱, 네이티브 앱 크게 3가지로 구분할 수 있다. 모바일 웹 방식은 웹 시스템을 모바일 사이즈에 맞게 개발하여 브라우저를 지원하는 모든 기기에서 사용할 수 있고 유지보수가 편한 장점이 있다. 그러나 디바이스의 리소스 접근이 힘들고 네트워크 사용이 힘든 경우 따로 기능을 사용 할 수 없다. 네이티브 앱 방식은 디바이스의 리소스 사용이 용이하고 네트워크 사용이 힘든 경우 기능 사용이 가능하나 OS별 개발과 버전별로 기능 구현에 따른 제약이 있고 유지보수가 힘들고 개발 비용이 많이 든다. 하이브리드 앱은 네이티브 앱과 웹 앱의 장점을 합친 형태로 핵심 기능들은 네이티브 앱으로 구현하고 지속적인 업데이트가 필요한 부분은 웹을 통해 관리하도록 구현한다. 때문에 디바이스 리소스 사용이 용이하고 네트워크 사용이 힘든 경우에도 기능 사용이 가능하다. 또 유지보수가 편하고 다양한 기기에 적용할 수 있는 장점이 있어 본 모바일 시스템은 하이브리드 앱 방식을 적용하여 개발하였다. 모바일서는 레이더 관측자료인 반사도와, 현재 강수량 및 10분 강우량, 1시간 강수량을 표출하였다.

  • PDF

오디세우스/parallel-OOSQL: 오디세우스 객체 관계형 데이터베이스 관리 시스템을 사용한 병렬 정보 검색 시스템 (ODYSSEUS/Parallel-OOSQL: A Parallel Information Retrieval System Using the Odysseus Object-Relational Database Management System)

  • 류재준;이재길;이민재;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2002
  • 인터넷의 성장과 함께 전자적인 형태로 표현되는 정보의 양이 급격하게 증가함에 따라, 문서를 병렬적으로 검색하는 병렬 정보 검색이 많은 양의 문서에 대한 빠른 검색을 지원하는 것에 있어 더욱 중요한 역활을 하고 있다. 병렬 정보 검색 시스템을 구현하기 위해서는 역 색인을 분활하고 분활된 역 색인을 병렬적으로 검색하는 것이 필요하다 역 색인을 분활하는 방법으로는 다음과 같은 두 가지 방법이 있다: 1) 문서 식별자를 기반으로 하는 분활 방법과 2) 키워드 식별자를 기반으로 하는 분활 방법. 그러나 각 방법은 단점들을 가지고 있다. 본 논문에서는 정보 검색 기능이 밀결합된 데이터베이스 관리 시스템인 오디세우스를 사용하여 병렬 정보 검색 시스템을 설계하고 구현한다. 첫째로, 기존의 역 색인 분할 방법을 분석하고 각 분말 방법의 단점들을 보완할 수 있는 혼합 분활 방법을 제안한다. 둘째로, 많은 양의 문서에 대해 성능 저하의 원인이 되는 대형 포스팅을 분할 하는 방법을 제안한다. 마지막으로 제안된 시스템의 유용성을 보이기 위해 실험을 수행한다. 예제 데이터베이스로서는 이백만 건의 웹 페이지를 사용한다. 실험 결과, 질의 저리 시간이 역 색인 분말의 블록의 개수에 근사하게 비례하여 줄어들고 시스템이 좋은 확장성을 가짐을 보인다.

  • PDF

워드넷 기반의 임의 추출 분할 방식을 이용한 동적 문제 출제 시스템 설계 (A Design of Dynamic Question Generation System using a Voluntary Extraction and Division Methodbased on WordNet)

  • 추승우;오정석;김유섭;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.283-285
    • /
    • 2004
  • 문제 은행 방식을 사용하는 웹 기반 학습 시스템의 문제점으로 지적되었던 문제 유출에 따른 평가의 공정성 문제를 해결하고자 임의 추출 분할 방식을 이용한 동적 문제 출제 시스템이 제안되었다. 하지만 이 시스템 또한 문제 은행 방식을 사용하여 위의 문제를 해결하려고 하였다. 본 논문에서는 이러한 문제점을 해결하기 위하여 단어간의 관계를 계층적으로 표현한 어휘 데이터베이스인 한국어 워드넷을 활용한 방법을 적용하였다 먼저 임의 추출 분할 방식으로 출제된 문제의 예제 문항을 형태소 분석기를 이용하여 명사들을 추출한다. 이 명사들을 이용하여 한국어 워드넷에서 해당 면사의 상위 개념 또는 동일 개념의 Synset을 추출한다. 이렇게 추출된 Synset으로 다른 예시 문항이지만 의미적으로 유사한 다양한 예제 문항을 생성하려는 시스템을 제안한다. 제안된 시스템의 사용으로 평가의 공정성 문제를 해결하고자 한다.

  • PDF

온톨로지를 이용한 인터넷웹 검색에 관한 실험적 연구 (An Experimental Study on the Internet Web Retrieval Using Ontologies)

  • 김현희;안태경
    • 정보관리학회지
    • /
    • 제20권1호
    • /
    • pp.417-455
    • /
    • 2003
  • 온톨로지는 웹자원을 지식화함으로써 정보의 효율적 검색. 통합, 재사용을 도모할 수 있는 새로운 기술인 시맨틱 웹의 구현을 위한 가장 핵심적인 요소 기술로 알려지고 있다. 온톨로지는 사람간에 그리고 서로 다른 응용 시스템간에 지식을 공유하고 재이용하는 방법을 제공하는 기술로서 특정 주제에 관한 지식 용어들의 집합으로서 이들 용어뿐만 아니라 용어간의 의미적 연결 관계와 간단한 추론규칙을 포함한다. 본 연구에서는 인터넷 웹상에서 국제기구에 관한 정보를 체계적으로 관리하고 검색하기 위해서 국제기구 온톨로지를 설계하고 이 온톨로지에 기반 하여 검색 시스템을 구현해 보고 이시스템을 20개의 탐색 질문들을 이용하여 기존의 인터넷 검색엔진과 적합성과 탐색 시간이라는 두가지 요인을 통해서 비교해 보았다. 실험 결과에 의하면 적합성 측정은 온톨로지 기반 시스템은 평균4.53. 인터넷 검색엔진은 평균 2.51로 온톨로지 기반 시스템의 적합도가 1.80배 높은 것으로 나타났다. 또한 탐색시간은 온톨로지 기반 시스템은 평균 1.96분, 인터넷 검색엔진은 평균 4.74분으로 인터넷 검색엔진이 온톨로지 기반 시스템 보다 2.42배 정도 더 많은 탐색시간이 필요한 것으로 나타났다.

퍼지 기반 웹서버 성능 분할 기법 (A Fuzzy Based Web Server Performance Isolation Method)

  • 박범주;박기진;김성수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.1499-1502
    • /
    • 2005
  • 본 논문에서는 차별화 서비스(Differentiated Service)를 구현하기 위하여 퍼지 이론을 적용한 웹 서버 컴퓨팅 노드들의 동적인 성능 분리(Performance Isolation) 기법에 관하여 논하였다. 제안된 기법은 컴퓨팅 노드의 현재 부하량, 사용자 계층별 요청률을 퍼지 입력 변수(Fuzzy Variables)로 하여, 애매모호한 노드의 정량적 부하를 정성적으로 표현할 수 있도록 하였으며, 이를 통해 계층별 요청률의 급격한 변화에 대응하여, 계층별 요청을 처리하는 담당 노드의 수를 동적으로 조절할 수 있게 하였다. 성능분석을 통해 제안된 퍼지 기반 성능 분리 방식의 서비스 응답시간이 퍼지기법을 사용하지 않은 일반적인 성능 분리에 비해 개선되는 것을 확인하였다.

  • PDF