Tuesday, November 20, 2018

National Data Day 2018

0


Image result for national data day 2018

Workshop National Data Day 2018
Senin, 19 November 2018
Gedung K (Damar) , Telkom University

National Data Day 2018 merupakan kompetisi big data yang diadakan oleh HMBTI Telkom University. Tema yang diangkat tahun ini adalah “Big Data for Big Solution”.
Kompetisi yang tersedia dan dapat diikuti adalah :
1. Open Data & Smart City
2. Data Science
3. Big Data Technology 4. Big Data & Data Analytics for Busines


 
        Pembicara pertama : Samuel Chan as Co Founder and Course Producer Algoritma
        "Introduction to R Programming for Data Science in General"
Machine Learning Vs. Artificial Intelligence
·    AI means that machines can perform tasks in ways that are "intelligent." These machines aren't just programmed to do a single, repetitive motion -- they can do more by adapting to different situations.
·    Machine learning is technically a branch of AI, but it's more specific than the overall concept. Machine learning is based on the idea that we can build machines to process data and learn on their own, without our constant supervision.
Compared to machine learning, AI describes a broad concept ("ideal) and Machine Learning in the other hand, offers a particular approach to arriving at that "ideal.
So is machine learning a subset of AI ? the answer is yes.




Question and Answer Session with Samuel Chan
Why do you phyton and R ?
·    Python memiliki konsep desain yang bagus dan sederhana, yang berfokus pada kemudahan dalam penggunaan. Kode Python dirancang untuk mudah dibaca, dipelajari, digunakan ulang, dan dirawat. Selain itu, Python juga mendukung pemograman berorientasi objek dan pemograman fungsional.

·   Python merupakan bahasa multifungsi. Dengan python Anda bisa melakukan berbagai hal mulai dari memproses teks, membuat website, membuat program jaringan, robotika, data mining, sampai dengan kecerdasan buatan. Dengan python Anda bisa membuat aplikasi berbasis desktop maupun berbasis smartphone.


            Does bussiness person need to understand how machine learning works ?
Yes. karena machine learning memiliki aplikasi di sebagian besar industri, di mana ia menyajikan peluang besar untuk memperbaiki proses yang ada.

            What kind of company that really need data scientist?
            Any company need data scientist, contohnya adalah financial industries.
           
            What is the best way to learn data scientist ?
            Career Move : Practical steps
a)  Say you want to land a job at Airbnb, read anything you want about being employed at Airbnb
b)  Develop fluency and familiarity in the skills and tools
c)   Get mentorship and immerse yourself in the community

For example, search about “How R helps Airbnb make the most of its data”
At Airbnb, R has been amongst the most popular tools for doing data science in many different contexts, including generating product insights, interpreting experiments, and building predictive models. In a recent survey of the Airbnb team, 73% of Data Scientists and Analysts rated themselves as closer to “Expert” than “Beginner” in using R, and 58% regularly use R as a language for data analysis. Airbnb supports R usage by creating internal R tools and by creating a community of R users. At the end of the post, the authors provide some specific advice for practitioners who wish to incorporate R into their day-to-day workflow.

Focus on Value Creation
Simple Practices :
·  What creates value for your company ?
·   How to do it faster ?
·   What can you learn that most immediately creates impact ?

            Increasing your production quantity and production quality is the best way to 

            demonstrate value.

            Deadly efficiency
· Learning Process : mentorship
· Workflow and Automation : R Scripts, Phyton Scripts
·  Tools : R Markdown to PDF, Word
·  Muscle Memory : solving question with as little code as possible
·  Value Creation

Being Deadly Efficient : Practical Steps
· Imitate process ; copy sistem
· Process oriented ; not results oriented
·  Fail - safe environment
·  Automate something every week

            Can bussiness management student be a data scientist ?
            Yes, obviously you can and dont be discourage

            I weak in linear algebra, can i became data scientics?
Yes, you can learn statistics, matrix algebra.
        


              Speaker from SCBD Researcher

1.       Arina Nahya as SCBD Researcher
“ Pattern identification using dynamic social network”
Research background :
·  Pengguna aktif social media di seluruh dunia dengan total 3.179 miliar dengan 42% penetrasi
·  Explosion of UGC = beberapa konten yang diunggah di social media
Based on research, orang orang diseluruh dunia sebelum mereka melakukan purchase, mereka ngecek di internet terhadap review orang2  
Research design and Methodology
·  Menggunakan phyton dan di import ke json
·  Mengupdate dari SNA menjadi DNA karena dapat dilihat dinamika nya

Conclusion :
·  SNA mengidentifikasi aktor-aktor yang paling berpengaruh, mengidentifikasi komunitas-komunitas yang terbentuk dalam nework sosial
·  DNA menunjukkan kepada kita pertumbuhan jaringan percakapan, dan menyusut selama waktu pengamatan. ini memberi kita pandangan yang terperinci tentang mekanisme jaringan
·   Interaksi di media sosial mencerminkan interaksi jaringan sosial dunia nyata
·   Saran untuk penelitian yang akan datang -> menggunakan data streaming

2.      Muhammad Fadhli Rachman As SCBD Researcher
“Ontology modelling approach for personality measurement based  on social media activity”
Untuk mengukur kepribadian, ada penelitian mengatakan bahwa tulisan dan linguistik dapat mengecek personality seseorang. Dan hasilnya adalah normative answer. Model ini dibuat untuk mencegah bayes.

Research Question
1. How to build ontology model to measure personality ?
2. How to build ontology model based on words that is written in Bahasa?

Methodology
=> Mengkombinasikan Ontology-berdasarkan Text Classification Dan Big Five Personality Traits
Komponen dari Ontology
a) Class
b) Instance
c)  Relation
Ontology mewakili hubungan antara entitas sehingga membentuk domain knowledge
Klasifikasi dilakukan dengan mencari kesamaan semantik pada dokumen
Big five personality traits
1. Opennes
2. Conscientiousness
3. Extraversion
4. Agreeablenes
5. Neuroticism

Experiment process
Twitter conversational data (R Studio) > Pre Processing  (R-Studio) > Word Collection > Ontology construction > ontology modelling > personality measurement



3.      Wachda Yuniar Rochmah as SCBD Researcher
“Understanding Public Opinion towards New Sharing Economy Business Model using Text Network Analysis”
Research Background
1. Sharing economy > benefits its stakeholders, ex : airbnb empowers many people around the world
2. User Generated Context > public opinion on social media towards new bussiness model

Methodology
1. Data collection using twitter streaming
2. Data Cleaning
3. Word co-occurance analysis menggunakan Wordij ( untuk mendapatkan pasangan kata dari frekuensi kata tersebut )
4. Setelah mendapatkan pasangan kata, melakukan text network visualization menggunakan Gephi
5. Interpretation
Dalam Text Network Analysis, kata-kata dominan dikonstruksikan menjadi jaringan, termasuk hasil the weighted edge

Conclusion :
·  Melihat hubungan suku kata lain dengan kata lainnya yang memiliki hubungan yang sangat kuat
·  Memberi kita kemampuan untuk meringkas percakapan skala besar

4.      M. Apriandito as SCBD Researcher
“ Object Detection Using Convolutional Neural Network To Identify Popular Fashion Product”
· Data yang ada di internet, tidak semuanya data structure. Namun juga ada unstructured data. Salah satu contoh unstructured data yang banyak digunakan adalah instagram. Ada sebanyak 60 juta foto yang di upload di instagram setiap harinya.
· Convolutional Neural Network  > tipe algoritma deep learning untuk mengklasifikasikan data dari gambar, video, text, sound.

Research Framework
·Data gathering > dengan menggunakan 3 sample kota di indonesia yaitu Jayapura, Bali, Jakarta
·  Data Filtering
· Model building > akan tertera berapa persen yang terdeteksi, misalkan kacamata ada 99%
· Mengukur akurasi, sensitivity, specificity, precision. Sample pengukurannya adalah penggunakan kacamata, hijab, dan topi

Conclusion :
Future research : mendeteksi seluruh fashion product yang digunakan oleh orang-orang, mengembangkan di lebih banyak kota tidak hanya 3 sample kota saja.






Tsalisa Nabila Adani
1401164235
MB4008





0 comments:

Post a Comment