裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

欠損値

2010年07月15日 | ブログラミング
欠損値が "-" で入っているデータを NA にするために,以下のようにする。

for (i in 3:8) {
#    kz[kz[,i] == "-", i] <- NA
    kz[,i] <- ifelse(kz[,i]!= "-", kz[,i], NA)<
    kz[,i] <- as.numeric(kz[,i])
}

kz[kz[,i] == "-", i] <- NA
をやろうとするとエラーになる。
以下にエラー `[<-.data.frame`(`*tmp*`, kz[, i] == "-", i, value = NA) :
missing values are not allowed in subscripted assignments of data frames

kz[,i] <- ifelse(kz[,i]!= "-", kz[,i], NA)
のようにすればよい。なぜだ。。。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

これだけで,ほかの人に伝わると思っているんだろうか

2010年07月15日 | 裏 RjpWiki
SensomineRの分散分析でのエラー †

Sensory? (2010-07-15 (木) 19:17:26)

お世話になります.Rも、プログラミングも完全に初心者です.よろしくお願い致します.

分散分析を行うと出現するエラーについてです.R,Rcommander,SensomineRを使っています.SensomineRよりpanel performance(分散分析)を起動させた場合,Product35×Panelist5×descriptor9ではエラーは出現しないのですが,Product31×Panelist5×descriptor9では,"置き換えるべき項目数が,置き換える数の倍数ではありませんでした”というエラーが出現します.

何か解決策があれば教えて頂けないでしょうか.よろしくお願い致します.


具体的なことがなんにもわかりませんなあ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ネットストーカーか?

2010年07月15日 | 裏 RjpWiki
ISP を変更するのでブログを引っ越そうと思って,セーブの上削除した。
しばらくしたら,「あのブログなくなったなあ」といわれたので,引っ越し作業を開始した。
たくさんあるので,後は又後でと思って寝て,朝起きたら,作業を中断したその数十分後に,「別の所に引っ越したようだよ」とのコメントあり。
ああ,びっくりしたなあ,もう。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

なんだかなあ

2010年07月15日 | 裏 RjpWiki
* 早速のリサーチありがとうございます。 -- sakura? 2010-06-05 (土) 16:06:38

あなたがやるべきことなんですよ

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

* plot(survfit(Surv(time, event)~group), col=1:2) でよいでしょう。ついでに,色分け方法も加えておきます。
survfit.formula のオンラインヘルプを熟読すると,使い方がよくわかるでしょう。 -- 河童の屁は,河童にあらず,屁である。? 2010-06-02 (水) 21:42:34
* 出来ました、早速”survfit.formula”を読んでみます。ありがとうございました。 -- ?アロバ? 2010-06-02 (水) 23:11:05


順序が逆
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

訳語

2010年07月15日 | 裏 RjpWiki
relative risk を「相対的なリスク」とか,lip cancer を「舌がん」と訳したのは,疫学(英語)を知らない人か?
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本語に不自由な質問者

2010年07月15日 | 裏 RjpWiki
一番最初の質問は,場所も不適切だったけど

**層別化 [#m01d3741]
>[[mtk]] (2010-05-09 (日) 13:27:24)

Rcmdrを開いた後,

データ → アクティブデータセット内の変数の管理 → 数値変数を因子に変換

で指定する。
層別化の便利な使い方があれば教えてください。


何が言いたいかと思っていたら,

mtk? (2010-05-09 (日) 20:52:56)

MS Windows XP sp3上でRcmdrを使っています。
ver.2.8.0では変数をcharacterに変更するだけで層別化の因子と認識されていました。
ver.2.11.0でRcmdr 1.5-4を起動したところ,これでは認識されませんでした。そこで

データ → アクティブデータセット内の変数の管理 → 数値変数を因子に変換

で指定したところ認識されました。これは仕様の変更なのかトラブルなのか分かりません。
もし仕様の変更なのでしたら層別化の便利な使い方があれば教えてください。

* > 層別化の便利な使い方があれば
というのは,「今まで(R-2.8.0)のようにもっと簡単な指定法はありませんか」ということですか? -- 日本語は難しい? 2010-05-10 (月) 20:59:15
* そういう意味です。ところで「デーセットの編集」画面で日本語が文字化けしていることと関係があるのでしょうか? -- mtk? 2010-05-10 (月) 21:02:50


なんだとさ。

さらに,

お騒がせしましたが,上記の情報は誤りで,ver.2.8.0でも数値変数を因子に変換しなければ層別化はできません。SPSSか何かと混同していました。すみませんでした。 -- mtk?2010-05-11 (火) 18:16:44


ときたもんだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ああ,やっとまともな道を探し当てたんだねえ

2010年07月15日 | 裏 RjpWiki
よかった,よかった。
とはいっても,私は,答えを提示できないんだ。ごめんね。

英語でテキストマイニングをする方法。語の頻度,形態素について †

ピースケ? (2010-04-29 (木) 17:51:37)

英語でテキストマイニングをする方法を探しています。。語の頻度,形態素について分析するパッケージはありますでしょうか。


−−−−−コメント

# ※コメントありがとうございます。日本語は,書籍が見かけたのですが,意外に英語のものがないです。※情報過多の時代なので,良質な情報をヒットさせることが,難しい時代ですね。 -- ピースケ? 2010-04-29 (木) 22:01:30

おやまあ。あなたは,英語の方が得意なんだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

こまったさん

2010年07月15日 | 裏 RjpWiki
注意書きも読まずに投稿するんだなあ。すぐ上に書いてあるのに。ここは,「R 掲示板」だってばさ。

最もいい方法を探すより,取りあえず自分にもできる方法を探す方が良いでしょう。教科書もいっぱい?出てるんだから,まずは本に書いてある方法をやってみれば?

回答を期待する記事は原則 質問コーナー Q&A にお願いします。「R 掲示板」はそれ以外の本来の(長めの)コメント専用にすることを提案したいと思います。


Rで英語のテキストマイニングを行いたいのですが,もっともいい方法はないでしょうか †

ピースケ? (2010-04-28 (水) 23:27:05)

Rで英語のテキストマイニングをしたいのですが,もっともいい方法はなんでしょう? 英語の論文などを分背kしたいです。


−−−−−コメント

ははは[E:cat]
その後,消去されたけど,以下のような経過があったんだ。証拠隠滅するには,ちゃんとやっておかないとね。未熟。

**Rで英語のテキストマイニングを行いたいのですが,もっともいい方法はないでしょうか [#f243b741] >[[ピースケ]] (2010-04-28 (水) 23:27:05)

Rで英語のテキストマイニングをしたいのですが,もっともいい方法はなんでしょう? 英語の論文などを分背kしたいです。

- その前に, このページを「分背k」することを勧めます. -- &new{2010-04-29 (木) 11:39:23};
- 「分背k(分析)」してみましたが(笑),的確なものがないですね。英語の形態素解析が行えるパッケージはあるのでしょうか。※知らない人には,調べようがないです。 -- [[ピースケ]] &new{2010-04-29 (木) 16:20:09};
- ここ質問する場所じゃないってことですよ。 -- &new{2010-04-29 (木) 16:58:51};
- 誠に失礼しました。 -- [[ピースケ]] &new{2010-04-29 (木) 17:49:50}; -

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

言うに事欠いて,そういう言いぐさはないだろ

2010年07月15日 | 裏 RjpWiki
- すみません.素人なもので.col.regions = trellis.par.get("regions")$col) どのように修正すればいいのか.よろしくご教授お願いします. -- [[orange]] &new{2010-04-26 (月) 20:35:42};

どうしようもないなあ
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

質問者自体よくわかっているんだろうか?

2010年07月15日 | 裏 RjpWiki
多次元項目反応理論のパッケージ † totoro? (2010-04-24 (土) 00:33:22)

Rで多次元項目反応理論(多次元IRT)または多次元カテゴリカル因子分析をしたいのですが、パッケージはありますでしょうか?

解析例などを示しているページがありましたら、教えていただけると幸いです。


久しぶりだが。
「多次元カテゴリカル因子分析」って,いったいなんなのさ。
ググっても出てこないでしょう。一般的でない用語,概念で質問しても,そんなものに回答はないでしょう。

まあ,えげつなく言えば,「あほか?」ということかな。

そもそも,因子分析なら多次元は当たり前だと思うし(単変量の因子分析があり得るか?)。

多次元を除いて「項目反応理論」や,「カテゴリカル因子分析」をまずは検索・探索することを勧めておこう。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ctable があると,jpg, png が描けない

2010年07月15日 | ブログラミング
LaTeX で,ctable があると,jpg, png が描けない
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

空白を含む文字列を描けない R は,馬鹿だ

2010年07月15日 | ブログラミング
plot(1:10); text(5, 5, "R は,馬鹿だ") は描けない。

plot(1:10); text(5, 5, "R_は,馬鹿だ") は描けるのに。直しもしない。

いくら free ware といっても,そうとう恥ずかしい状況だ。

え,なんで,私が直さなきゃならないの?直す能力なんてないんだから,しょうがないじゃない。

−−−−−コメント(なかま)
IPAフォントを使って下さい. この現象はヒラギノのOTFでしか発生しません. IPAフォント(現在はOTF)はOSXの10.6.2以降は登録可能です. 10.6以降フォント周りが結構変わったので, 本来ならば新しいAPIに書き換えれば問題ないのかもしれませんが(10.6では非推奨のAPIを使っています), 欧文フォントの方で問題(Type1とか)が出る可能性が非常に高いので, R財団のサポートメンバーの母国語の比率を鑑み先送りすることにしました.

−−−−−コメント(わたし)
「ヒラギノのOTFでしか発生しません」へー,そうですか。ヒラギノって,よほど特殊で,考慮する価値もないってことですか。ならいいよ。べつにIPAフォント使おうと思わないから,「R はしょうもない奴だ」と思い続けることにしよう。ほんとうに,ばかだ。

−−−−−コメント(okumura)
Osakaでもいいんですね text(5, 5, "R は",family="Osaka")

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ks.test の使い方

2010年07月15日 | ブログラミング
データの正規性を検定するとき,ks.test の引数はどのようにしたらよいのだろうか。

x <- c(2, 3, 5.1, 7, 1, 9, 3.4, 5.4, 5.9)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x))
ks.test(scale(x), "pnorm")

どちらも同じ結果になる

> x <- c(2, 3, 5.1, 7, 1, 9, 3.4, 5.4, 5.9)
> ks.test(x, "pnorm", mean=mean(x), sd=sd(x))

One-sample Kolmogorov-Smirnov test

data: x
D = 0.1327, p-value = 0.9906
alternative hypothesis: two-sided

> ks.test(scale(x), "pnorm")

One-sample Kolmogorov-Smirnov test

data: scale(x)
D = 0.1327, p-value = 0.9906
alternative hypothesis: two-sided
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本語の変数名

2010年07月15日 | 裏 RjpWiki
そんなもの,使えなくったって何の不都合もないだろう。しかも,Windows の場合のようだし。

* ↓carパッケージ利用で、Anova(lm(抑うつ~完全主義*失敗経験)) のように日本語変数名で実行するとエラーとなります。それを指してのことでしょう。2.10からエラーです。 -- OGA? 2010-01-19 (火) 22:12:06
* 2要因分散分析のエラーとは何でしょうか? -- 2010-01-19 (火) 15:03:47
* 2要因分散分析のエラーは,改善されるのでしょうか -- 2010-01-19 (火) 00:08:58
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

data.frame を html ファイルとして書き出す

2010年07月15日 | ブログラミング
library(xtable)
print(xtable(iris[1:10, 1:4]), type="html")

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PVアクセスランキング にほんブログ村

PVアクセスランキング にほんブログ村