cannalab

Python

【Python】pyenvで環境構築

構築例 // pyenvをインストール 適当なディレクトリで下記コマンドを実行 $ git clone git://github.com/yyuu/pyenv.git ./.pyenv $ git clone git://github.co...
VMware

ホストと仮想マシンでフォルダを共有する

まずは、VMware-toolsというのをインストールする ・カーネルのバージョンを確認する uname -mr 3.10.0-229.el7.x86_64 x86_64 ・確認したカーネルバージョンのモジュールをインストールする。 yum...
MariaDB(MySQL)

【MySQL】DBのダンプファイルから任意のテーブルのみリストアする方法

DBの全てのテーブルのダンプを取得したけど、 容量がデカすぎる、、、さらには、その一部のテーブルのみ必要 そんなときに役立ったのがこちらのコマンド 環境は CentOS6 MySQL まずは「DROP TABLE IF EXISTS XXX...
Python

Googlebot かどうかの確認

サイトにどのくらいクローラーがきてるのか? ってのは、サーチコンソールである程度わかるけど どのページに?どの階層配下に?っていう詳細になると アクセルログを解析する必要が、、、 でも、ログの何を見ればいいのか? 一番単純なのは、UAに「g...
Google search console

pythonで検索アナリティクスAPIを試す

Google Search Console(GSC)の検索アナリティクスAPIを試す。 まだまだ解説してるサイトが少ない気がする。。。 環境は、 CentOS7 Python3.5 ■ ステップ1:Search Console APIを有効...
Python

word2vec を wikiデータを使って検証してみる

言葉の足し算やら引き算やらができるという word2vecとやらを試してみたよ! ・下準備 まずは、こちらのサイトからwikiのデータを取得 wget 約20分くらいかな 次に、落としてきたデータがxml形式なので、 こちらをテキスト形式に...
PHP

【php】htmlソースを取得する

PHPを使って、proxy経由でURLにアクセスして HTMLソースを取得したかった 取得先がhttpとhttpsで、若干違ったのでメモメモ $opt = array( "http" => array( "proxy" => "tcp://...
Python

【Python】 プロキシを通してURLをたたく

Python3でプロキシを通してアクセスしたいときの手順をメモメモ import urllib.request opener = urllib.request.build_opener() proxy_handler = urllib.re...
Python

【Python】 メインコンテンツを抽出

サイト上のページから、メインコンテンツだけを抽出したいな~ って思っても、ロジックが複雑そ~ って思って、あきらめていたらこんな便利なものが~ ってことでメモメモ 言語はPythonなのだけれど、ちょうど今マイブームなので問題なしっw re...
Python

Python3でMySQL に接続してみる

Python3でMySQLを普通に使おうと思ったら エラーが出たので、そのときの対処をメモメモ 何も考えずに MySQLdbをインポートしたところ import MySQLdb No module named 'MySQLdb' って怒られ...