1: 田杉山脈 ★ 2019/01/12(土) 18:37:50.17 ID:CAP_USER
「Python」と「R」はデータサイエンティスト職の求人で最も多く要求されるスキルに数えられている。ところが、こうしたプロフェッショナルの仕事で最も頻繁に使用されているプログラミング言語について調査した複数の報告書によると、実際は評価が分かれるという。Cloud Academyの米国時間12月27日付の報告書で明らかになった。
まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm
まず、TIOBE Programming Community Indexによれば、2018年の検索エンジンのリクエスト数でみたRの順位は下降気味だったという。だが、データプロフェッショナル1万6000人を対象に実施したKaggleの調査では、全体で最も人気の高いプログラミング言語はPythonであるものの、統計およびデータサイエンティストは他のどの職務よりも業務でRを使用している割合が高いことが分かった。データサイエンティストの87%はPythonを、71%はRを業務で使用していると回答していると、同報告書に記
以下ソース
https://japan.techrepublic.com/article/35131060.htm
2: 名刺は切らしておりまして 2019/01/12(土) 18:38:58.81 ID:UT9z2lcu
データサイエンティストに求められるのは言語ではない
数字を読む能力なのに
数字を読む能力なのに
4: 名刺は切らしておりまして 2019/01/12(土) 18:55:36.17 ID:K7woRKwy
Rは統計データを扱うのに特化した言語であって
システムを組むには不向きなだけだろ
5: 名刺は切らしておりまして 2019/01/12(土) 18:55:39.34 ID:ekSjywov
データをnumpyとかpandaとかに整形するのがめんどいんじゃ糞が
6: 名刺は切らしておりまして 2019/01/12(土) 18:57:58.43 ID:dibLf/yi
Python 遅いけど、、
使いやすいし、便利なライブラリも多い。
使いやすいし、便利なライブラリも多い。
7: 名刺は切らしておりまして 2019/01/12(土) 19:05:32.54 ID:XHrLj9Fn
基本をC、ライブラリは都合のいいもの。今はたしかにPython。
Rは統計というかデータベース用だとおもう。
Rは統計というかデータベース用だとおもう。
8: 名刺は切らしておりまして 2019/01/12(土) 19:09:51.27 ID:hEuBy7aA
Rubyは流行ることなく終わったな
9: 名刺は切らしておりまして 2019/01/12(土) 19:11:30.41 ID:WUJUgZ1h
なぜ Rだと思う? 記者の取材不足?
10: 名刺は切らしておりまして 2019/01/12(土) 19:15:41.63 ID:ephSBmTY
最近は機械学習系のライブラリがみんなPythonだからな
イヤでも使うしかない
イヤでも使うしかない
11: sage 2019/01/12(土) 19:24:51.91 ID:OWQfCzk/
>>10
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない!
>最近は機械学習系のライブラリ
プログラマー全体の何パーセントが,「機械学習系のライブラリ」を
使用するのか? これがPythonの人気の主な理由とは思えない!
12: 名刺は切らしておりまして 2019/01/12(土) 19:27:11.26 ID:H29X4LK5
いよいよボッキデータの真髄、といったところか
15: 名刺は切らしておりまして 2019/01/12(土) 19:34:39.49 ID:H9+KMJVU
その辺の言語は文法が少し違うだけで
どれも同じだよ
どれも同じだよ
16: 名刺は切らしておりまして 2019/01/12(土) 19:41:12.41 ID:ephSBmTY
>>11
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう
ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる
最後は何を作りたいかで決まるでしょう
この記事はデータサイエンティスト限定の話だし
もちろん他の用途では事情は変わってくるだろうね
機械学習いらんってことなら、別の言語でも全然構わないだろう
ちなみにPythonでプログラム書いてWebサイトを立ち上げようとすると
素のApacheですぐに動かないから微妙に面倒くさい
Djangoとかのフレームワークを使う手もあるけど、
それぞれにクセがあって多少手間がかかる
最後は何を作りたいかで決まるでしょう
17: 名刺は切らしておりまして 2019/01/12(土) 19:44:53.13 ID:d46EjDA9
numbaじゃなくてpsyco復活してほしい
cythonがまぁまぁ使いやすい
cythonがまぁまぁ使いやすい
18: 名刺は切らしておりまして 2019/01/12(土) 19:46:01.58 ID:0Stlar/u
Rを使うのは昔の文系統計屋だけ
データサイエンティストはRなんて使わないわな
データサイエンティストはRなんて使わないわな
19: 名刺は切らしておりまして 2019/01/12(土) 19:55:26.28 ID:SD42/tYe
assembler, bash, basic, c, cobol, java, perl, php, python, PL/M
人生最後の言語はrustだと思いたい
人生最後の言語はrustだと思いたい
20: 名刺は切らしておりまして 2019/01/12(土) 19:59:05.68 ID:q+VwURUA
データ解析といえばSASじゃないの?時代は変わったな
22: 名刺は切らしておりまして 2019/01/12(土) 20:11:46.83 ID:PAeBiU62
でもモジュール作る人はc/c++じゃないの?
データサイエンティストと言う人らはフロントだけを作るの?
データサイエンティストと言う人らはフロントだけを作るの?
24: 名刺は切らしておりまして 2019/01/12(土) 20:16:59.67 ID:sJf3fT7h
Rはデータ処理しやすいから好き
書き方も好き
書き方も好き
25: 名刺は切らしておりまして 2019/01/12(土) 20:17:56.46 ID:7pg+voxm
これはおかしい
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった
Pythonが言語として優れてるわけでなく、グーグルとか多数企業が
数値計算、AI関連のモジュールもあとから追加したからだろ。
Javascriptでもよかった
27: 名刺は切らしておりまして 2019/01/12(土) 20:27:33.19 ID:bz9KFmyJ
普段業務でR言語を利用するなんて日本なわけないと思ったらやっぱり日本じゃなかった
28: 名刺は切らしておりまして 2019/01/12(土) 20:33:18.62 ID:FyOIkd6T
>>27
別に日本でも使うだろ。
研究者やデータサイエンティストとかなら。
ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ
別に日本でも使うだろ。
研究者やデータサイエンティストとかなら。
ITドカタだけが仕事でプログラミングしてるわけじゃねーんだぞ
29: 名刺は切らしておりまして 2019/01/12(土) 20:37:41.08 ID:bz9KFmyJ
>>28
趣味レベルだろ
趣味レベルだろ
31: 名刺は切らしておりまして 2019/01/12(土) 20:41:28.24 ID:FyOIkd6T
>>29
仕事で使ってるんだぞ?立派な業務使用。
商用ソフトのクオリティではないだけの話。
そこは目的が違うだけ。
英語で言ったら「英語は通訳しか仕事で使わない」
と言ってるようなもん
仕事で使ってるんだぞ?立派な業務使用。
商用ソフトのクオリティではないだけの話。
そこは目的が違うだけ。
英語で言ったら「英語は通訳しか仕事で使わない」
と言ってるようなもん
32: 名刺は切らしておりまして 2019/01/12(土) 20:43:09.54 ID:FyOIkd6T
日本のプログラマに多い、
SIとかでクライアントの社内システムしこしこ作ってるようなのが、
むしろプログラマーの中では底辺だからな。
SIとかでクライアントの社内システムしこしこ作ってるようなのが、
むしろプログラマーの中では底辺だからな。
33: 名刺は切らしておりまして 2019/01/12(土) 20:51:34.47 ID:RxXl9REQ
Rかじった程度の統計の人やプログラム未経験だけどとにかくクエリは自力でかけますみたいな人たちにとっては取っつきやすいみたいですね
純粋なプログラマーにはクソ言語にしか見えない
純粋なプログラマーにはクソ言語にしか見えない
34: 名刺は切らしておりまして 2019/01/12(土) 20:55:54.96 ID:FyOIkd6T
純粋なプログラマーって言い方が謎だが、
プログラミングそのものでお金をもらってるのと、
何か成果を出すためにプログラミングをツールとして
使ってる人ではそりゃ見方が違うだろ。
プログラミングそのものでお金をもらってるのと、
何か成果を出すためにプログラミングをツールとして
使ってる人ではそりゃ見方が違うだろ。
37: 名刺は切らしておりまして 2019/01/12(土) 21:44:28.59 ID:bl6GrAb2
Python簡単で便利だしな
情報工学の基礎を学んでない人でも扱える
情報工学の基礎を学んでない人でも扱える
38: 名刺は切らしておりまして 2019/01/12(土) 22:03:11.01 ID:PAeBiU62
じゃあなに、偉そうに書いている割に俺らと一緒でAPIをぽちぽち叩く人らなんだ
なんだそれ
なんだそれ
39: 名刺は切らしておりまして 2019/01/12(土) 22:12:15.59 ID:03hknbTV
>>38
プログラミング環境はただの道具
実現したいことがさくっと実現できればそれでおk
と通りすがりのScheme使いが言ってみる
プログラミング環境はただの道具
実現したいことがさくっと実現できればそれでおk
と通りすがりのScheme使いが言ってみる
41: 名刺は切らしておりまして 2019/01/12(土) 23:06:28.94 ID:or34q7p2
>>38
勝手に偉そうに感じてるだけだろ
単純な関数みたいには使いこなせんよ
勝手に偉そうに感じてるだけだろ
単純な関数みたいには使いこなせんよ
42: 名刺は切らしておりまして 2019/01/12(土) 23:21:51.98 ID:Jk8z6VDP
お前らプログラムやってるのか知らんがデータサイエンティストはお前らと全く違う職種だから
言語ってスレタイで自分の領域だと勘違いして入るのはクルマの免許しかないやつがバイクスレに入るようなもん
言語ってスレタイで自分の領域だと勘違いして入るのはクルマの免許しかないやつがバイクスレに入るようなもん
44: 名刺は切らしておりまして 2019/01/12(土) 23:50:23.56 ID:Pf6VbnVt
マジレスすると一番必要なのはSQLだろ笑笑
47: 名刺は切らしておりまして 2019/01/13(日) 00:07:23.78 ID:wx3Zu4C3
>>42
データサイエンティストと組んで仕事してるけど
今時は理論だけじゃ仕事にならんよ
システムに組み込める形にできないと
データサイエンティストと組んで仕事してるけど
今時は理論だけじゃ仕事にならんよ
システムに組み込める形にできないと
48: 名刺は切らしておりまして 2019/01/13(日) 00:12:37.48 ID:GObm6Thu
python は perl5 の次のステップアップで覚えた言語
データ処理は出力がある程度まとまっている Rに任せてる
データ処理は出力がある程度まとまっている Rに任せてる
49: 名刺は切らしておりまして 2019/01/13(日) 00:13:11.03 ID:tG0QmgRX
クルマに例えるなら、日本でプログラマといって連想する人たちはタクシーやトラックの運転手に当たる。
で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。
クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、
タクシーやトラックの運転手しかないから国民は
「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」
あろうことか、そのトラックやタクシーの運転手たちが
「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。
トヨタの開発者?俺たちより運転してないだろ」
とメーカーの社員よりえらぶってる状況。それが日本のIT業界。
で、日本に自動車メーカーがないようなもんだな。日本のIT業界を例えると。
クルマに関わる人は本来、メーカーの社員、大学の社員、レーサーとか色々いるけど、
タクシーやトラックの運転手しかないから国民は
「将来は車を扱うんだというと、トラックやタクシーの運転手しか連想できない」
あろうことか、そのトラックやタクシーの運転手たちが
「俺たちが車を一番運転してるから、車のことを一番分かってるんでい。
トヨタの開発者?俺たちより運転してないだろ」
とメーカーの社員よりえらぶってる状況。それが日本のIT業界。
50: 名刺は切らしておりまして 2019/01/13(日) 00:31:45.30 ID:Ci4YzD6F
細かなところで言語仕様がイラッとくるから好きじゃない
52: 名刺は切らしておりまして 2019/01/13(日) 00:42:52.73 ID:VgsFpufp
なんで電子マネーみたいに無駄にポコポコ新言語作るんだ?
53: 名刺は切らしておりまして 2019/01/13(日) 00:53:09.41 ID:Ci4YzD6F
>>52
AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、
プログラミングのパラダイムが変遷して、その変化に合わせたりとか、
プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。
ただpythonは結構古い。もうすぐ30年になる。
AIやらディープラーニングやら目的が細分化して、その用途に合わせるためだったり、
プログラミングのパラダイムが変遷して、その変化に合わせたりとか、
プラットフォームの多様化して、固有のプラットフォームに特化したりとかで様々。
ただpythonは結構古い。もうすぐ30年になる。
56: 名刺は切らしておりまして 2019/01/13(日) 01:02:03.59 ID:rs+IoQeE
うちはブルジュアだからSAS
59: 名刺は切らしておりまして 2019/01/13(日) 01:28:48.85 ID:13OGwtBI
python自体は遅いけどnumpyのようなライブラリは早いじゃん
60: 名刺は切らしておりまして 2019/01/13(日) 01:29:31.94 ID:Lqlv4ZuM
データサイエンティスト≒統計家じゃね
62: 名刺は切らしておりまして 2019/01/13(日) 01:45:45.24 ID:LP8DwHKq
ややこしいのは、新しい機械学習のアルゴリズムを作る
例えばヒントンのような人はコンピュータサイエンティストの
くくりの方が適切(多分)ってこと。
そういう意味でデータサイエンティストよりデータアナリストとか
統計技術者という言い方の方が適切なのかもしれない。
例えばヒントンのような人はコンピュータサイエンティストの
くくりの方が適切(多分)ってこと。
そういう意味でデータサイエンティストよりデータアナリストとか
統計技術者という言い方の方が適切なのかもしれない。
63: 名刺は切らしておりまして 2019/01/13(日) 02:02:49.47 ID:Xagx+4Vu
データサイエンティストとデータアナリストは別な
データアナリストはExcelでグラフ作ってプレゼンしたりする奴ら
データサイエンティストはRやPythonで予測モデルを作る奴ら
データアナリストはExcelでグラフ作ってプレゼンしたりする奴ら
データサイエンティストはRやPythonで予測モデルを作る奴ら
65: 名刺は切らしておりまして 2019/01/13(日) 02:29:01.95 ID:caw1iggm
データアナリスト = データを分析して傾向を割り出す
データサイエンティスト = データを分析して予測を立てる
機械学習エンジニア = 鑑別器の正解率を高めるように特徴量を際立たせる
こんな感じか?
66: 名刺は切らしておりまして 2019/01/13(日) 02:34:11.89 ID:yQoop5da
ヘボい
こんなんで年収がいいんだ、おれもデーターサイエンティスト()目指そうかな
こんなんで年収がいいんだ、おれもデーターサイエンティスト()目指そうかな
70: 名刺は切らしておりまして 2019/01/13(日) 04:08:52.57 ID:YYj9J9ni
技術スレ特有の
上から目線のきもいヤツ湧きすぎ
上から目線のきもいヤツ湧きすぎ
71: 名刺は切らしておりまして 2019/01/13(日) 04:26:14.26 ID:PCzZ6H6e
π損もやっといた方がいいかなー
色んな言語に手を出すには日本人エンジニアの余暇は少なすぎるのだけど
色んな言語に手を出すには日本人エンジニアの余暇は少なすぎるのだけど
73: 名刺は切らしておりまして 2019/01/13(日) 05:43:02.74 ID:ZgmZpark
データサイエンティスト?
また胡散臭げなコンサルがでてきたんか
また胡散臭げなコンサルがでてきたんか
74: 名刺は切らしておりまして 2019/01/13(日) 08:25:50.71 ID:QussHjZD
ライブラリ頼みでPython使ってるだけでデータサイエンティストとかw
76: 名刺は切らしておりまして 2019/01/13(日) 09:04:17.78 ID:8E8SQ8s3
真のデータサイエンティストならば断定口調で語る可能性は優位にあるとは言えない
79: 名刺は切らしておりまして 2019/01/13(日) 09:28:44.13 ID:R/3igTmB
言語、言語言ってる連中は間違いなく素人。
プロのこだわりはドメイン設計とメッセージングとデザインパターン
これに尽きる。
プロのこだわりはドメイン設計とメッセージングとデザインパターン
これに尽きる。
81: 名刺は切らしておりまして 2019/01/13(日) 11:29:55.10 ID:L0m1Tzpz
単なる分析屋なの?
新しいアルゴリズム開発するとかじゃないのか。
新しいアルゴリズム開発するとかじゃないのか。
83: 名刺は切らしておりまして 2019/01/13(日) 12:40:47.79 ID:4VcpaMum
今メインはMatlab+Statistical Toolboxで計算してて,たまにR使うくらいなんだけど,
Pythonに置き換えるってのはなんかメリットある?
やってるのはMCMCとかの1000行くらいから10000行くらいの計算。
Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。
Pythonに置き換えるってのはなんかメリットある?
やってるのはMCMCとかの1000行くらいから10000行くらいの計算。
Matlab使いやすいからずっと使ってるんだけど,最近Pythonをよく聞くのでちょっと気になってる。
84: 名刺は切らしておりまして 2019/01/13(日) 12:56:12.84 ID:BC+9xAcO
論文読んでアルゴリズムを拝借するだけの
データサイエンティスト馬鹿にしてるくらいなんだから
きっと著名なアルゴリズムを生み出して
社会に貢献をしてるんだろうなあ
データサイエンティスト馬鹿にしてるくらいなんだから
きっと著名なアルゴリズムを生み出して
社会に貢献をしてるんだろうなあ
90: 名刺は切らしておりまして 2019/01/13(日) 13:57:47.62 ID:D4GElc6G
全部VBでできるだろ
VB.NETを使えっての
てか、データサイエンティストって何なんだよ
VB.NETを使えっての
てか、データサイエンティストって何なんだよ
92: 名刺は切らしておりまして 2019/01/13(日) 15:03:08.00 ID:YWud//Y+
dplyrが出てからpythonでなくてもRは前処理楽になったよ。
Rとpython両方できてないと他人のコード読めないので、片方だけという
人は少ない
Rとpython両方できてないと他人のコード読めないので、片方だけという
人は少ない
95: 名刺は切らしておりまして 2019/01/13(日) 15:46:50.50 ID:RuWdLfwG
ExcelとRで回帰分析しかできないようなのはなんちゃってデータサイエンティスト。
それでもデータで経営層を動かせるからプログラマーより評価されるだけ。
それでもデータで経営層を動かせるからプログラマーより評価されるだけ。
96: 名刺は切らしておりまして 2019/01/13(日) 16:45:22.54 ID:maVCz2LA
なんだよ
回帰分析って
そんなの知らねーよ
回帰分析って
そんなの知らねーよ
105: 名刺は切らしておりまして 2019/01/13(日) 19:23:23.14 ID:+BOauHG8
Rは時代の敗北者じゃけえ
106: 名刺は切らしておりまして 2019/01/13(日) 19:46:14.85 ID:kjkKo3BF
統計つかうときはEZRでやってる
本職でもなんでもないし
本職でもなんでもないし
109: 名刺は切らしておりまして 2019/01/14(月) 01:07:16.91 ID:ANYUp8A4
抽象的な話じゃなくてデータサイエンティストのすごい論文って具体的にどれよ
元スレ:http://egg.5ch.net/test/read.cgi/bizplus/1547285870/