5,754 research outputs found

    Improved Parallel Rabin-Karp Algorithm Using Compute Unified Device Architecture

    Full text link
    String matching algorithms are among one of the most widely used algorithms in computer science. Traditional string matching algorithms efficiency of underlaying string matching algorithm will greatly increase the efficiency of any application. In recent years, Graphics processing units are emerged as highly parallel processor. They out perform best of the central processing units in scientific computation power. By combining recent advancement in graphics processing units with string matching algorithms will allows to speed up process of string matching. In this paper we proposed modified parallel version of Rabin-Karp algorithm using graphics processing unit. Based on that, result of CPU as well as parallel GPU implementations are compared for evaluating effect of varying number of threads, cores, file size as well as pattern size.Comment: Information and Communication Technology for Intelligent Systems (ICTIS 2017

    BindingDB in 2015: A public database for medicinal chemistry, computational chemistry and systems pharmacology.

    Get PDF
    BindingDB, www.bindingdb.org, is a publicly accessible database of experimental protein-small molecule interaction data. Its collection of over a million data entries derives primarily from scientific articles and, increasingly, US patents. BindingDB provides many ways to browse and search for data of interest, including an advanced search tool, which can cross searches of multiple query types, including text, chemical structure, protein sequence and numerical affinities. The PDB and PubMed provide links to data in BindingDB, and vice versa; and BindingDB provides links to pathway information, the ZINC catalog of available compounds, and other resources. The BindingDB website offers specialized tools that take advantage of its large data collection, including ones to generate hypotheses for the protein targets bound by a bioactive compound, and for the compounds bound by a new protein of known sequence; and virtual compound screening by maximal chemical similarity, binary kernel discrimination, and support vector machine methods. Specialized data sets are also available, such as binding data for hundreds of congeneric series of ligands, drawn from BindingDB and organized for use in validating drug design methods. BindingDB offers several forms of programmatic access, and comes with extensive background material and documentation. Here, we provide the first update of BindingDB since 2007, focusing on new and unique features and highlighting directions of importance to the field as a whole

    計算生物学におけるカーネル法(数学者のための分子生物学入門,研究会報告)

    Get PDF
    この論文は国立情報学研究所の電子図書館事業により電子化されました。1.緒言 計算生物学の研究目的の一つは、実験的研究により生成される大量のデータを解析し、生物学的に有用な仮説を自動的に導くための計算手法を開発することである。また、生物学においては多種多様なデータが生成されるため、それらを統合して扱うことのできる数学的枠組みを見出すことは重要な課題の一つである。計算生物学において対象となるデータには、遺伝子配列データ、化学構造データ、遺伝子発現データなどがあるが、ここでは、これらを統一的に扱うことを可能とするカーネル法について説明する。カーネル法はここ十年間に機械学習分野において発展してきた手法であり、生物学を含む数多くの問題に応用されている。2. Mercerカーネル 集合Xの直積から実数へ関数K(x,y)が、対称性(K(x,y)=K(y,x))を満たし、さらに、正定値性を満たす場合に、関数K(.,.)はMercerカーネルと呼ばれる。K(.,.)がMercerカーネルである場合、あるヒルベルト空間Φ、および、XからΦへの関数φ(x)が存在し、K(x,y)はφ(x)とφ(y)の内積となる。より、厳密にはRKHS (reproducing kernel Hilbert space)と呼ばれるヒルベルト空間を用いることにより、MercerカーネルとRKHSを対応づけすることができる。また、RKHSの重要な性質として、RKHSが無限次元空間であっても、ある条件下で正則化された関数の最小化が有限個の点のみを考慮することで行えるということがあげられる。3.カーネル法 カーネル法の大きな利点の一つとして、ヒルベルト空間へ写像すること無しに種々の計算が行えることがあげられ、このことはカーネルトリックと呼ばれる。簡単な例としてはヒルベルト空間における2点間の距離がカーネル関数の簡単な組み合わせで求めることができる。より有用な例として、統計解析の主要手法の一つである主成分分析(PCA)が、カーネルを用いた場合にも、ヒルベルト空間における計算なしに行える。カーネルを用いた正準相関分析(CCA)は固有値計算問題に帰着することができ、二種類のデータを統合した解析を行うのに有用である。サポートベクターマシン(SVM)はカーネル法に基づく(教師あり)機械学習のための手法で、正負の例が与えられた時、正負の例を分離し、かつ、最近点までの距離(マージン)が最大となる超平面を計算する。実際には、正負の例を完全に分離することが不可能である場合が多いので、分類誤差と距離をトレードオフしたものを最適化する。SVMでは、カーネルトリックにより、最適な分離超平面が(多くの場合には少ないサイズの)正負の例の部分集合に対するカーネルの組み合わせにより表現される。4.タンパク質データに対するカーネル法 カーネル法を生物学データに適用するため、タンパク質や関連するデータに対するカーネル関数が提案されている。特に、配列(文字列)に対するカーネル関数はよく研究されている。長さkの部分文字列の出現頻度のベクトルを用いることにより、文字列からユークリッド空間へのカーネル関数を定義できるが、この手法はspectrumカーネルと呼ばれている。また、配列解析に広く利用されている確率モデルである隠れマルコフモデル(HMM)などから情報を抽出することによりカーネル関数を定義する、Fisherカーネルも提案されている。配列データ以外には、遺伝子発現データ、Phylogenetic Profileなどを扱うためのカーネルや、グラフ構造に関するdiffusionカーネルとカーネルCCAを組み合わせ代謝パスウェイと発現データの相関を抽出する研究などが行われている。カーネルの組み合わせに関する研究も行われており、半正定値計画法による、カーネルの線形結合の最適化などが研究されている

    p-Adic Mathematical Physics

    Full text link
    A brief review of some selected topics in p-adic mathematical physics is presented.Comment: 36 page
    corecore