top of page
M.R
ソフトウェア開発などについての情報を綴ります
検索
2021年7月15日
タオル交換監視の機械学習モデルの改善
概要 WEBカメラで掛タオルを監視し、交換されたら通知するシステムを作りました。 「タオルがあるかないか」はWEBカメラの画像を機械学習して判定しているのですが、やはり最初のうちは誤検出が多かったです。色々工夫して誤検出を減らすことができたので方法をご紹介します。...
2021年6月30日
「家事チェックアプリ」にキッチンのタオル交換を追加
概要 前回、FlutterとRaspberry Piを用いて掛タオルの交換を監視するアプリを作りました。そこに、キッチンの掛タオルの交換を監視するタスクも追加しました。 詳細:スマホアプリ側 スマホアプリ側は前回すでに汎用的に作っていたので、今回は「+」ボタンをタップして新...
2021年6月4日
画像認識で画像のリサイズと正解率、判定時間の関係を調べてみた
概要 現在、カメラで撮影した画像を機械学習で判定する、というプロジェクトを作成しています。その際、撮影した画像そのままだと処理が重くなり、学習や判定に時間がかかってしまうので、対策として画像を粗くしてみようかと思いました。...
2021年4月13日
Raspberry piでkerasを使う時に注意すること
概要 Raspberry piでディープラーニングをしようと思いkerasをインストールしたら、importの時点で以下のエラーが出る ValueError: numpy.ndarray size changed, may indicate binary...
2021年3月28日
[python]機械学習で間違えた部分を可視化する
概要 機械学習を行っていると、「作成したモデルがどのデータで間違えているのか」を知りたくなることがあります。すべてのカテゴリに対して等しく間違えているのか?それともあるカテゴリのデータだけ間違える確率が高いのか?などが分かればモデルの修正方法のヒントになるかもしれません。...
2021年3月27日
[python]2つの項目の値に応じてデータの分布を可視化する
概要 データの分布を可視化するにはseabornのcountplotやdistplotなどが使えます。また、ある項目の値に応じてデータの分布を可視化したい場合は、jointplotを使ったり、countplotの引数hueを利用したりできます(例:図1)。以前、各変数の属性...
2021年2月21日
C#でpythonで書いた機能を実行する方法まとめ
概要 C#を使って作っているwindowsアプリケーションにpythonで書いた機能を組み込みたくなることがあります。具体的には機械学習とか画像認識とかですね。そんな時に使える方法はいくつかあるのでまとめてみました。 1. ...
2021年1月1日
勾配ブースティングの中を見てみる
概要 これまでDecisionTreeClassifierとRandomForestClassifierのソースを見てきました。今回はRandomForestClassifierと同じくDesicionTreeClassifierのensembleである勾配ブースティング(...
2020年12月31日
RandomForestClassifierの中を見てみる
概要 前回sklearnのDecisionTreeClassifierのソースを見てみました。しかし現実にはDecisionTree単体で用いられることはなく、それらを集めたensembleとして使われることが一般的です。そこで、そんなensembleのうちで最も単純なRa...
2020年12月31日
DecisionTreeClassifierの中を見てみる
概要 機械学習をするためのメソッドは数多くありますが、kaggleなどで人気が高いのはXGBMやLightGBMなどの決定木を利用するものです。今回はそんな決定木が学習をするアルゴリズムを調べてみました。 詳細の前に 決定木とはなんぞや、についてはこの記事などを読んでみてく...
2020年10月15日
[python] k-meansクラスタリングをするときはデータの規格化、標準化をする
概要 とある機械学習の問題に取り組んでいるときに、データをk-meansクラスタリングしてみた。ところが、どうもある一つのカラムの値に依存しすぎているように見えた。こうならないためには、事前にデータの大きさを揃えておかないといけない。 k-meansクラスタリングとは...
2020年8月11日
[python]機械学習の回帰問題でMSE以外でモデルを評価する方法
はじめに 機械学習で回帰問題に取り組む際、モデルの評価には一般にmse(平均二乗誤差)が用いられます。しかし、実際にやっているとmseでは分からない場合もあるんですよね。そこで、今回はmse以外で回帰モデルを評価する方法を考えたので紹介しようと思います。 mseの弱点...
2020年8月11日
[python]データの可視化と相関関係の把握を同時に行う
はじめに データ分析の際にはグラフを用いてデータを可視化すると思います。そのとき、2変数の相関を表す統計量も同時に表示できたら便利ですよね。そこで、変数の内容(カテゴリか数値か)に応じて適切なグラフに適切な統計量を表示できるようにしました。 これまでのおさらい...
2020年8月10日
[python]カテゴリ変数についても相関を求める方法
はじめに データ分析の際には与えられたデータにおいて変数間の相関関係を調べると思います。数値同士の相関は相関係数を調べればよいですが、一方または両方がカテゴリの場合はどうしたらいいのかな?と思って調べたのでまとめます。 数値 vs 数値...
2020年8月10日
[python]データをどうやって可視化するか
はじめに kaggleのcompetitionなど、機械学習を行う際にはまず最初にやるのはデータの可視化ではないでしょうか。そしてデータの可視化にはseabornを使うことが多いかと思います。でもグラフにも色々種類があってどれを使うか迷ってしまうことってありませんか?(僕は...
2020年8月10日
Seabornでhueを引数に持たないメソッドでも色分けをする方法
はじめに データを綺麗なグラフで可視化できるライブラリseaborn。なかでもいくつかのメソッドではhueという引数にカテゴリを指定すると、そのカテゴリごとに色分けをしてグラフを描いてくれます。ところが、一部のメソッドはこのhueを引数にとらないものもあります。そんな場合で...
2020年8月10日
Pandasでデータ全体の概要を把握するメソッド
はじめに データ分析を行っていると、データ全体がどうなっているのかな?と確認したい場合がありますよね。そこで、pandasでデータ全体の概要を見る方法について書いてみようと思います。初めに既存のメソッドをまとめ、その後自作したメソッドを紹介しようと思います。...
bottom of page