opencvのインストールログ

環境 Ubuntu 10.04 64ビット python 2.6.5 インストールログ 基本的に http://opencv.willowgarage.com/wiki/InstallGuide%20%3A%20Debian に書いてあるとおり実行しました。 一部インストールするパッケージを変更しています。 IPPやTBBはインストールして…

見出し語化の高速化

nltkのWordNetLemmatizerを力ずくで高速化した。 環境 Python 2.6.5 コード # -*- coding: utf-8 -*- from collections import defaultdict import nltk from nltk.corpus import wordnet as _wordnet _STEMMER = nltk.PorterStemmer().stem _LEMMATIZATION_…

pythonによる文字列の正規化

テキストマイニングなどを行うためには文書、文、単語などの文字列の正規化が重要です。 単語の大文字小文字の統一、半角全角の統一などをする必要があります。 文字列の正規化のために利用しているpythonコードを以下に書いておきます。 今後増える可能性も…

nkf python インターフェースのインストール

環境 Ubuntu 10.04 32ビット python 2.6.5 インストール方法 $ mkdir temp # 作業用ディレクトリの作成 $ cd temp # http://sourceforge.jp/projects/nkf/ から nkf-2.1.1.tar.gz をダウンロード temp$ tar zxvf nkf-2.1.1.tar.gz temp$ cd nkf-2.1.1/ temp/…

Pythonにおける並行処理について

気になったのでPythonのGIL(Global Interpreter Lock)が並行処理にどの程度影響するかについて少し実験しました。 はじめに まず、「並行」処理と「並列」処理という言葉を区別する必要があります。下記参考文献の「並行コンピュータ技法」によると、 システ…

ALAssetsLibraryについて

iOS

以下は私がWebや書籍から集めた情報や、私が試行錯誤した経験により、ALAssetsLibraryについてまとめたものです。 そのため、間違いが含まれている可能性があります。何かしらの間違いを見つけた方はご指摘願います。 はじめに ALAssetsLibraryとはiOS4で追…

docx, xlsx, pptxファイルからテキストをXMLとして抽出する

MS Office 2007以降のファイル(.docx, .xlsx, .pptx)はZip圧縮されたXMLファイルなので、ファイルからのテキスト抽出などが簡単にできます。 .pptxファイルをZipファイルとして展開すると上記のようになります。 各スライドがXMLファイルとして保存されてい…

不正な(malformed)HTMLテキストを修正する

Web上のHTMLテキストには不正な(malformed)形式を持っている場合があります。 malformedなHTMLテキストにに対してはBeautifulSoupやHTMLParserなどがうまく機能しません。 例えば以下の3つのパターンはBeautifulSoupでは例外が生じます。 1. タグの閉じ>が無…

OpenOffice形式に変換する

OpenOffice形式(ODF:.odt, .ods, .odpなど)はZip圧縮された複数のXMLファイルなので、テキストを抽出したりするのが容易です。 一方、以前のMS Office形式(.doc, .xls, .pptなど)はバイナリ形式なのでテキスト抽出などは困難です。 なのでOpenOffice形式への…

ALAssetsLibraryでiPhone,iPadの写真フォルダにアクセスする

// MyAssetManager.h #import <Foundation/Foundation.h> #import <AssetsLibrary/AssetsLibrary.h> @interface MyAssetsManager : NSObject { ALAssetsLibrary *assetsLibrary_; } - (void)addObserverForAssetsLibraryChange:(id)anObserver selector:(SEL)aSelector; - (void)removeObserverForAssetsLibraryChange</assetslibrary/assetslibrary.h></foundation/foundation.h>…

XCodeのiPhone,iPadプロジェクトの設定

XCodeでiPhone,iPad用アプリを作成する際にまず設定していること。 LOG関数の設定 // ProjectName_Prefix.pch #ifdef DEBUG #define LOG(...) NSLog(__VA_ARGS__); #define LOG_METHOD NSLog(@"%s", __func__); #else #define LOG(...) ; #define LOG_METHOD…

Google Chromium OS + Chromiumのビルド方法

Google Chromium OSをソースからビルドする。ただしChromiumはローカルのソースを使用する。[1]Chromium OS Developer Guide - The Chromium Projects [2]Build Instructions (Chromium OS on Linux) - The Chromium Projects以下は2010/12/23時点でのビルド…

テキストを走査する

備忘録も兼ねてPowerPointプレゼンテーション内のテキストを走査するためのクラスを作成しました。 走査する単位はCharacter, Run, Word, Line, Sentence, Pragraphから選択できます。 using PowerPoint = Microsoft.Office.Interop.PowerPoint; using Offic…

Google Chromium OSのビルド方法

Google Chromium OSをソースからビルドする。[1]Chromium OS Developer Guide - The Chromium Projects以下は2010/12/17時点でのビルドログ兼ビルド方法です。ビルド方法は頻繁に変更されるため、最新のビルド方法は[1]を参照してください。 はじめに ホーム…

編集中のプレゼンテーション、スライドを取得する

using PowerPoint = Microsoft.Office.Interop.PowerPoint; public partial class ThisAddIn { PowerPoint.Presentation GetActivePresentation() { return this.Application.ActivePresentation; } PowerPoint.Slide GetActiveSlide() { return this.Applic…

選択中のスライド、シェイプを取得する

using PowerPoint = Microsoft.Office.Interop.PowerPoint; public partial class ThisAddIn { PowerPoint.Selection GetSelection() { try { return this.Application.ActiveWindow.Selection; } catch (System.Runtime.InteropServices.COMException exc) …

VSTOファイルのパスを取得する

レジストリに登録されている情報を利用して.vstoファイルのパスを取得する方法。 private const string REGKEY_ADDIN = @"Software\Microsoft\Office\PowerPoint\AddIns\MyPowerPointAddIn"; string GetVstoFilePath() { Microsoft.Win32.RegistryKey regkey…

マーク

久しぶりにChromium OSのソースをsyncさせたらこんなのが出力されました。 面白かったので記念に。 Syncing work tree: 100% (86/86), done. ..77IIIIII7,. .$IOOOOOOOOOOZ$:. .IO8?OOOOOOZOOOOOOOO. ?=?~?ZO+D8888=+OZOOOOI. .7$+I+++888$IIO$8+=OZZZOI. .Z…

アドインのインストーラを作成する

アドインプロジェクトの変更 インストーラを作成したアドインプロジェクトを開きます。ここではMyPowerPointAddInプロジェクトとします。[1]http://code.msdn.microsoft.com/VSTO3MSI/Release/ProjectReleases.aspx?ReleaseId=729リンク[1]からVSTO v3 Deplo…

無効なアプリケーションアドインからの復帰

作成しているアドイン内で例外が生じた場合や、デバッグ中にVisual Studio側からでバグを停止したりすると、アドインが無効にされてしまいます。[1]How to: Re-enable a VSTO Add-in that has been disabled - Visual Studio | Microsoft Docs詳しくは[1]に…

何もしない空のPowerPointアドインの作成

アドインの中身は後々追加するとして、とりあえず何もしないPowerPointアドインを作成します。 Visual Studioで新規プロジェクトを作成します。 PowerPoint2007アドインを選択します。 ここではC#で選択しますが、VB.NETでも同様だと思います。 アドイン名は…

VSTOでPowerPointのCOMアドインを作成する

VSTO(Visual Studio Tools for Office)を使用するとVisual StudioでMicrosoft Officeようのアドインを作成することができます。VBAではなくC#、VB.NETを使用できます。VSTOでPowerPointのCOMアドインを作成した備忘録を少しずつ書いていきます。 間違った方…

ImageSetter ver.1.0.0

ImageSetter ver.1.0.0を公開します。 概要 画像ファイルをスライドとして挿入するPowerPointアドイン 必要環境 .NET Framework 3.5以降 Microsoft Visual Studio Tools for the Microsoft Office system (Version 3.0 Runtime)以降 動作確認 windows XP(32b…

GhostscriptでPDFを画像に変換する

windows版ghostscript(gswin32c)を使用する場合 gswin32c ^ -dSAFER ^ -dQUIET ^ -dNOPAUSE ^ -dBATCH ^ -dWINKANJI ^ -dFirstPage=FIRST_PAGE ^ -dLastPage=LAST_PAGE ^ -dUseCropBox ^ -sDEVICE=DEVICE_NAME ^ -rRESOLUTION ^ -sOutputFile=OUTPUT_FILE ^ …

LaTeXBox2e ver.2.0.0

LaTeXBox2e ver.2.0.0を公開します。 概要 TeXの数式・図式をPowerPointに貼り付けるためのアドイン 特徴 EPSもEMFも経由せずに数式の貼り付けを行う フォントの埋め込みが可能 コンパイル回数の指定が可能 日本語にも対応 日本語フォントの指定が可能 画像…

Google Chromium OS + Chromiumのビルド方法

より新しいビルド方法はこちら Google Chromium OSをソースからビルドする。ただしChromiumはローカルのソースを使用する。[1]http://www.chromium.org/chromium-os/building-chromium-os [2]Chromium OS + Chromiumビルドログ(まとめ): TorasenLab@Seesaa以…

Google Chromium OSのビルド方法

より新しいビルド方法はこちらGoogle Chromium OSをソースからビルドする。[1]http://www.chromium.org/chromium-os/building-chromium-os [2]Chromium OS ビルドログ(まとめ): TorasenLab@Seesaa以下はseesaaの方に書いておいたビルドログ[2]をまとめたもの…