Workshop National Data Day 2018
Senin, 19 November 2018
Gedung K (Damar) , Telkom University
National Data Day 2018 merupakan kompetisi big data yang diadakan oleh HMBTI
Telkom University. Tema yang diangkat tahun ini adalah “Big Data for Big Solution”.
Kompetisi yang tersedia dan dapat diikuti adalah :
1. Open Data & Smart City
2. Data Science
3. Big Data Technology
4. Big Data & Data Analytics for Busines
Pembicara pertama : Samuel Chan as Co Founder and
Course Producer Algoritma
"Introduction to R Programming
for Data Science in General"
Machine Learning Vs. Artificial Intelligence
· AI means that machines can perform tasks
in ways that are "intelligent." These machines aren't just programmed
to do a single, repetitive motion -- they can do more by adapting to different
situations.
· Machine learning is technically a branch
of AI, but it's more specific than the overall concept. Machine learning is
based on the idea that we can build machines to process data and learn on their
own, without our constant supervision.
Compared to machine learning, AI describes a broad
concept ("ideal) and Machine Learning in the other hand, offers a
particular approach to arriving at that "ideal.
So is machine learning a subset of AI ? the answer is
yes.
Question and Answer Session with Samuel Chan
Why do you phyton and R ?
· Python memiliki konsep desain yang bagus
dan sederhana, yang berfokus pada kemudahan dalam penggunaan. Kode Python
dirancang untuk mudah dibaca, dipelajari, digunakan ulang, dan dirawat. Selain
itu, Python juga mendukung pemograman berorientasi objek dan pemograman
fungsional.
· Python merupakan bahasa multifungsi.
Dengan python Anda bisa melakukan berbagai hal mulai dari memproses teks,
membuat website, membuat program jaringan, robotika, data mining, sampai dengan
kecerdasan buatan. Dengan python Anda bisa membuat aplikasi berbasis desktop
maupun berbasis smartphone.
Does bussiness person need to
understand how machine learning works ?
Yes. karena machine learning memiliki aplikasi di
sebagian besar industri, di mana ia menyajikan peluang besar untuk memperbaiki
proses yang ada.
What kind of company that really
need data scientist?
Any company need data scientist,
contohnya adalah financial industries.
What is the best way to learn
data scientist ?
Career Move :
Practical steps
a) Say you want to land a job at Airbnb, read
anything you want about being employed at Airbnb
b) Develop fluency and familiarity in the
skills and tools
c) Get mentorship and immerse yourself in the
community
For example, search about “How R helps Airbnb make the
most of its data”
At Airbnb, R has been amongst the most popular tools
for doing data science in many different contexts, including generating product
insights, interpreting experiments, and building predictive models. In a recent
survey of the Airbnb team, 73% of Data Scientists and Analysts rated themselves
as closer to “Expert” than “Beginner” in using R, and 58% regularly use R as a
language for data analysis. Airbnb supports R usage by creating internal R
tools and by creating a community of R users. At the end of the post, the
authors provide some specific advice for practitioners who wish to incorporate
R into their day-to-day workflow.
· What creates value for your company ?
· What can you learn that most immediately
creates impact ?
Increasing your production quantity
and production quality is the best way to
demonstrate value.
· Learning Process : mentorship
· Workflow and Automation : R Scripts,
Phyton Scripts
· Tools : R Markdown to PDF, Word
· Muscle Memory : solving question with as
little code as possible
Being Deadly Efficient : Practical Steps
· Imitate process ; copy sistem
· Process oriented ; not results oriented
· Fail - safe environment
· Automate something every week
Can bussiness management student
be a data scientist ?
Yes, obviously you can and dont be
discourage
I weak in linear algebra, can i
became data scientics?
Yes, you can learn statistics, matrix algebra.
Speaker
from SCBD Researcher
1. Arina Nahya as SCBD Researcher
“ Pattern identification using dynamic social network”
· Pengguna aktif social media di seluruh
dunia dengan total 3.179 miliar dengan 42% penetrasi
· Explosion of UGC = beberapa konten yang
diunggah di social media
Based on research, orang orang diseluruh dunia sebelum
mereka melakukan purchase, mereka ngecek di internet terhadap review orang2
Research design and Methodology
· Menggunakan phyton dan di import ke json
· Mengupdate dari SNA menjadi DNA karena
dapat dilihat dinamika nya
· SNA mengidentifikasi aktor-aktor yang
paling berpengaruh, mengidentifikasi komunitas-komunitas yang terbentuk dalam
nework sosial
· DNA menunjukkan kepada kita pertumbuhan
jaringan percakapan, dan menyusut selama waktu pengamatan. ini memberi kita pandangan
yang terperinci tentang mekanisme jaringan
· Interaksi di media sosial mencerminkan
interaksi jaringan sosial dunia nyata
· Saran untuk penelitian yang akan datang
-> menggunakan data streaming
2.
Muhammad Fadhli Rachman As SCBD Researcher
“Ontology modelling approach for personality
measurement based on social media activity”
Untuk mengukur kepribadian, ada penelitian mengatakan
bahwa tulisan dan linguistik dapat mengecek personality seseorang. Dan hasilnya
adalah normative answer. Model ini dibuat untuk mencegah bayes.
1. How to build ontology model to measure
personality ?
2. How to build ontology model based on words
that is written in Bahasa?
=> Mengkombinasikan Ontology-berdasarkan Text
Classification Dan Big Five Personality Traits
Ontology mewakili hubungan antara entitas sehingga
membentuk domain knowledge
Klasifikasi dilakukan dengan mencari kesamaan semantik
pada dokumen
Big five personality traits
Twitter conversational data (R Studio) > Pre
Processing (R-Studio) > Word Collection > Ontology construction
> ontology modelling > personality measurement
3. Wachda Yuniar Rochmah as SCBD Researcher
“Understanding Public Opinion towards New Sharing
Economy Business Model using Text Network Analysis”
1. Sharing economy > benefits its
stakeholders, ex : airbnb empowers many people around the world
2. User Generated Context > public opinion
on social media towards new bussiness model
1. Data collection using twitter streaming
3. Word co-occurance analysis menggunakan Wordij
( untuk mendapatkan pasangan kata dari frekuensi kata tersebut )
4. Setelah mendapatkan pasangan kata,
melakukan text network visualization menggunakan Gephi
Dalam Text Network Analysis, kata-kata dominan
dikonstruksikan menjadi jaringan, termasuk hasil the weighted edge
· Melihat hubungan suku kata lain dengan
kata lainnya yang memiliki hubungan yang sangat kuat
· Memberi kita kemampuan untuk meringkas
percakapan skala besar
4. M. Apriandito as SCBD Researcher
“ Object Detection Using Convolutional Neural Network
To Identify Popular Fashion Product”
· Data yang ada di internet, tidak semuanya
data structure. Namun juga ada unstructured data. Salah satu contoh
unstructured data yang banyak digunakan adalah instagram. Ada sebanyak 60 juta
foto yang di upload di instagram setiap harinya.
· Convolutional Neural Network >
tipe algoritma deep learning untuk mengklasifikasikan data dari gambar, video,
text, sound.
·Data gathering > dengan menggunakan 3
sample kota di indonesia yaitu Jayapura, Bali, Jakarta
· Model building > akan tertera berapa
persen yang terdeteksi, misalkan kacamata ada 99%
· Mengukur akurasi, sensitivity,
specificity, precision. Sample pengukurannya adalah penggunakan kacamata,
hijab, dan topi
Future research : mendeteksi seluruh fashion product
yang digunakan oleh orang-orang, mengembangkan di lebih banyak kota tidak hanya
3 sample kota saja.
Tsalisa Nabila Adani
1401164235
MB4008