iampaul83's blog
 

Recent posts

蔡柏伍

12 April 2017

Deal with missing data

Spark SQL有一個DataFrameNaFunctions可以很方便地處理missing data

03 December 2016

Scala map function

Array.map可以有效幫你去除重複程式碼,這篇文章以Spark ML Pipeline為例子,先示範如何用map改寫重複程式,接著示範如何跟Pipeline結合

02 December 2016

NGINX gzip 沒有正常運作的解決方式

我在弄的網站,主要是顯示一些資料,由於後端的data source優化非常差,常常會有「網頁上要顯示5個數字,但是我需要和後端拿30MB的json檔案」這種恐怖情況發生。

02 December 2016

使用Mongodb

Spark使用Mongodb的方法,使用mongodb官方提供的connector

02 December 2016

← Older posts Page 1 of 2 Newer posts →
All content copyright iampaul83 © 2017 • All rights reserved.
Made with Jekyll and AMP project